相关题目
单选题
()算法是一种挖掘关联规则的频繁项集算法,其核心思想是通过候选集生成和情节的向下封闭检测两个阶段来挖掘频繁项集。
单选题
在Apriori算法中,候选项集划分为不同的桶,存放在()中。
单选题
如果规则集R中不存在两条规则被同一条记录触发,则称规则集R中的规则为()。
单选题
子集搜索中,逐渐增加相关特征的策略称为()。
单选题
在图集合中发现一组公共子结构,这样的任务称为()。
单选题
Spark是专为大规模数据处理而设计的快速通用的计算引擎,将Job中间输出结果可以保存在()中,从而不再需要读写HDFS。因此Spark能更好地适用于数据挖掘与机器学习等需要迭代的MapReduce的算法。
单选题
在Spark中引入RDD概念的目的是实现()。
单选题
Spark技术架构的资源层主要涉及两种角色,分别是()。
单选题
()负责资源管理和所有作业的控制,而()负责接收来自JobTracker的命令并执行它。
单选题
当Map任务完成时,()接收到位置和大小的更新信息,并推送给Reduce任务。
