相关题目
单选题
MapReduce中,Master服务器负责将一个Map任务分派给()。
单选题
MapReduce中,运行程序副本程序的机器分为()和()两类。
单选题
数据存储是大数据平台的根本,没有了存储平台,数据也就没有了载体。()
单选题
数据采集与接入的范围包括一级部署业务系统、二级部署业务系统(含自建)和外部系统一手数据接入,满足大数据平台一手数据全的要求。()
单选题
在Spark中引入RDD概念的目的是实现Spark的串行操作和灵活的容错能力。()
单选题
Hadoop的MapReduce与Spark都可以进行数据计算,而相比于MapReduce,Spark的速度更快并且提供的功能更加丰富。()
单选题
Spark本身并没有提供分布式文件系统,因此Spark的分析大多依赖于Hadoop的分布式文件系统HDFS。()
单选题
RDD中所有的操作都是Lazy模式进行,运行在编译中不会立即计算最终结果,而是记住所有操作步骤和方法,只有显示遇到启动命令才执行。()
单选题
Spark是以RDD概念为中心运行的。()
单选题
Spark基于内存计算,本身可以直接读写Hadoop上任何格式数据,其应用程序在集群上以独立的进程集合的形式运行。()
