单选题
一个MapReduce程序中的MapTask的个数由()决定。
A
输入的总文件数
B
客户端程序设置的mapTask的个数
C
FileInputFormat.getSplits(JobContextjob)计算出的逻辑切片的数量
D
输入的总文件大小/数据块大小
答案解析
正确答案:C
解析:
MapReduce编程模型中的MapTask的并行度决定机制是由FileInputFormat.getSplits(JobContextjob)决定的。该方法的返回值是Listsplits,这个结果集合中的每个InputSplit就是一个逻辑输入切片,每个逻辑输入切片在默认情况下是会要启动一个MapTask任务进行计算的,因此C对。
题目纠错
相关题目
单选题
以下关于DataNode的描述不正确的是?
单选题
以下方法中,更适用于处理序列数据的有(____)。
单选题
以下程序的输出结果是(____)。(提示:'a'的ASCII码为97)$;$lista = [1,2,3,4,5,'a','b','c','d','e']$;$print(lista[2] + lista[5])
单选题
以下不属于推断统计的是(____)。
单选题
以下不属于数据库的是(____)。
单选题
以下不属于数据科学主要研究目的是(____) 。
单选题
以下不属于数据科学家主要职责的是(____) 。
单选题
以下不属于马尔可夫随机场模型与条件随机场模型的差别的是(____)。
单选题
以下python代码运行结果为(____)。$;$def Sum(a, b=3, c=5):$;$ return sum([a, b, c])$;$print(Sum(a=8, c=2))$;$print(Sum(8))$;$print(Sum(8,2))
单选题
以下( )组件负责生成和维护全局事务ID、事务快照、时间戳等全局唯一信息。
