相关题目
单选题
Hadoop的MapReduce与Spark都可以进行数据计算,而相比于MapReduce,Spark的速度更快并且提供的功能更加丰富。()
单选题
Spark本身并没有提供分布式文件系统,因此Spark的分析大多依赖于Hadoop的分布式文件系统HDFS。()
单选题
RDD中所有的操作都是Lazy模式进行,运行在编译中不会立即计算最终结果,而是记住所有操作步骤和方法,只有显示遇到启动命令才执行。()
单选题
Spark是以RDD概念为中心运行的。()
单选题
Spark基于内存计算,本身可以直接读写Hadoop上任何格式数据,其应用程序在集群上以独立的进程集合的形式运行。()
单选题
Hive定义了一种类似SQL的查询语言(HQL),将HQL转化为MapReduce任务在Hadoop上执行,通常用于在线分析。()
单选题
HDFS系统支持数据的修改。()
单选题
HDFS对大文件的处理能力较强,但是对于小文件,尤其是大量的小文件的处理能力反而较弱。()
单选题
HBase可以有列,可以没有列簇。()
单选题
HBase对于空(NULL)的列,不需要占用存储空间。()
