单选题
RDD的特点不包括()。
A
RDD之间有依赖关系,可溯源
B
RDD由很多partition构成
C
对RDD的每个split或partition做计算
D
RDD可以增量更新
答案解析
正确答案:D
解析:
RDD具有以下五大特点:①RDD由很多partition构成;②对RDD做计算,相当于对RDD的每个split或partition做计算;③RDD之间有依赖关系,可溯源;④如果RDD里面存的数据是key-value形式,则可以传递一个自定义的partitioner进行重新分区,比如可以按key的hash值分区;⑤最优的位置去计算,即数据的本地性。
题目纠错
相关题目
单选题
考虑以下场景,Hbase中有列簇CF1,列C1,C2。当读取Hbase表时,只要求返回C1的列值,使用下列那个选项可以实现该功能?
单选题
卷积神经网络能通过卷积以及池化等操作将不同种类的鸟归为一类。关于卷积神经网络能达到该效果的原因,下列说法不正确的是(____)。
单选题
距离超平面最近的几个训练样本称为支持向量,两个异类支持向量到超平面的距离之和为(____)。
单选题
进行场景迁移的前提条件说法错误的是:( )。
单选题
交叉验证的目的是(____)。
单选题
将数据块存储大小设置为128M, HDFS客户端在写文件时,当写入一个100M大小的文件,实际占用储存空间为:( )。
单选题
将闵可夫斯基距离和(____)结合即可处理混合属性。
单选题
将python中的.py文件转换为.pyc文件的组件为(____)。
单选题
剪枝是决策树学习算法对付(____)的主要手段。
单选题
假设属性income的最大最小值分别是98000元和12000元。利用最大最小规范化的方法将属性的值映射到0至1的范围内。对属性income的73600元将被转化为(____)。
