相关题目
MapReduce 在中间 key 值采用分区函数进行数据的分区,并将分区结果传给后续任务执行进程。( )
对 Master 故障,一个简单的解决办法是让 Master 周期性地将输出结果写入磁盘, 并设置检查点。当 Master 任务失效时,可以从最后一个检查点开始启动另一个Master 进程。( )
Partition()函数 / 分区函数:MapReduce 对 map()函数的输出的中间 key 值使用分区函数来对数据进行分区处理,为每个 Reduce 任务创建一个分区。( )
为了降低 map()函数与 reduce()函数之间的数据传递量,一般采用 combiner() 函数对 map()函数的输出结果进行合并处理。( )
Shuffle 处理:为了确保每个 reduce()函数的输入都按键排序。( )
用户自定义的reduce()函数接受一个中间key 值和一个相关的value 值的集合。( )
MapReduce 计算框架的计算过程分为 Map 阶段和 Reduce 阶段两个阶段,并分别以两个函数 map()和 reduce()进行抽象。( )
key 和 value 可以是未经加工的字节数据。( )
MapReduce 计算过程中,相同的 key 默认会被发送到同一个 ReduceTask 处理。( )
链式 MapReduce 计算中,对任意一个 MapReduce 作业,Map 和 Reduce 阶段可以有无限个 Mapper,但 Reducer 只能有一个。( )
