相关题目
MapReduce中,当Reduce Worker接收到Master发来的数据存储位置信息后,通过远程调用从Map Worker所在主机的磁盘上读取()输出的中间结果。
MapReduce中,(key,value)在本地磁盘上的存储位置将传给Master,由Master负责把这些存储位置再传送给()。
MapReduce中,通过分区函数将已缓存的(key,value)分成R个区城,并周期性地写入到()。
MapReduce中,被分派到Map任务的Worker程序读取相关的输入分片,从输入分片中解析出(key,value)然后把(key,value)传递给用户自定义的()。
MapReduce中,Master服务器负责将一个Map任务分派给()。
MapReduce中,运行程序副本程序的机器分为()和()两类。
数据存储是大数据平台的根本,没有了存储平台,数据也就没有了载体。()
数据采集与接入的范围包括一级部署业务系统、二级部署业务系统(含自建)和外部系统一手数据接入,满足大数据平台一手数据全的要求。()
在Spark中引入RDD概念的目的是实现Spark的串行操作和灵活的容错能力。()
Hadoop的MapReduce与Spark都可以进行数据计算,而相比于MapReduce,Spark的速度更快并且提供的功能更加丰富。()
