相关题目
单选题
采用Nestloop算子实现连接操作没有限制。
单选题
Zookeeper的增强性包括在审计日志中添加ephemeral node被删除的审计日志。
单选题
Yarn-client和Yarn-Cluster主要区别时Application Master进程的区别。
单选题
Structuredstreaming可以将过去的输入流缓冲为流状态,以便将每个未来输入与过去的输入相匹配,从而生成流连接结果。
单选题
Spark是基于内存的计算引擎,所有Spark程序运行过程中的数据只能存储在内存中。
单选题
Spark根据RDD的依赖关系来划分stage,调度器从DAG图末端出发,逆向遍历整个依赖关系,遇到窄依赖就断开,遇到宽依赖就将其加入当前stage。
单选题
Spark Streaming作为微批处理的流处理引擎,是将每个时间分片的数据转换为一个RDD中的一 个分区进行计算。
单选题
Spark Streaming容错机制实质RDD中的任意Partition出错,都可以根据其父RDD重新计算生成,如果父RDD丢失,则需要去硬盘中查找原始数据。
单选题
Spark Streaming可以从Kafka接收数据并进行计算,计算结果只能存入HDFS,不能再写回Kafka。
单选题
Spark On Yarn模式下的driver只能运行在客户端。
