相关题目
单选题
147.SparkContext根据RDD的依赖关系构建DAG图,DAG图提交给DAG调度器(DAGScheduler)进行解析。
单选题
146.利用文件管理系统可以长期的保存数据,但无法实现数据共享。
单选题
145.分布式数据库具有数据安全性高、保密性强的特点。
单选题
144.在HDFS中,数据读写都遵循就近原则,即数据存储到离客户端最近的数据节点中。
单选题
143.在噪声数据中,波动数据比离群点数据偏离整体水平更大。
单选题
142.Spark使用DAG(有向无关图)执行引擎以支持循环数据流与内存计算。
单选题
141.阿里云集成工具是批量数据同步工具。
单选题
140.在聚类分析当中,簇内的相似性越大,簇间的差别越大,聚类的效果就越差。
单选题
139.在MapReduce v2架构中,资源分配的单位是Container。
单选题
138.商业领域大数据能够快速、直接地体现出来价值。
