相关题目
单选题
在 Spark 中引人 RDD 概念的目的是实现 Spark 的串行操作和灵活的容错能力。( )
单选题
Hadoop 的 MapReduce 与 Spark 都可以进行数据计算,而相比于 MapReduce,Spark的速度更快并且提供的功能更加丰富。( )
单选题
Spark 本身并没有提供分布式文件系统,因此 Spark 的分析大多依赖于 Hadoop 的分布式文件系统 HDFS。( )
单选题
RDD 中所有的操作都是Lazy 模式进行,运行在编译中不会立即计算最终结果,而是记住所有操作步骤和方法,只有显示遇到启动命令才执行。( )
单选题
Spark 是以 RDD 概念为中心运行的。( )
单选题
Spark 基于内存计算,本身可以直接读写 Hadoop 上任何格式数据,其应用程序在集群上以独立的进程集合的形式运行。( )
单选题
Hive 定义了一种类似 SQL 的查询语言(HQL),将 HQL 转化为 MapReduce 任务在Hadoop 上执行,通常用于在线分析。( )
单选题
HDFS 系统支持数据的修改。( )
单选题
HDFS 对大文件的处理能力较强,但是对于小文件,尤其是大量的小文件的处理能力反而较弱。( )
单选题
HBase 可以有列,可以没有列簇。( )
