相关题目
单选题
MapReduce 性能优化的评估大部分都是基于 Counter 的数值表现出来的。( )
单选题
Combiner 运行 0 次、1 次或多次,Reducer 都会产生相同的输出结果。( )
单选题
Shuffle 横跨 Map 端和 Reduce 端,在 Map 端包括 Spill 过程,在Reduce 端包括copy和 sort 过程。( )
单选题
MapReduce 中的 Shuffle 更像是洗牌的逆过程,把一组无规则的数据尽量转换成一组具有一定规则的数据。( )
单选题
MapReduce 为海量的数据提供了存储架构。( )
单选题
数据服务是指针对用户不太明确的数据查询和处理任务,以高性能和高吞吐量的方式实现大众化的服务,是数据价值最重要也是最直接的发现方式。( )
单选题
数据科学家应该学会数据科学的基础理论,尤其是其主要理念、原则、理论和方 法。( )
单选题
数据科学家需要拥有数据产品的研发能力,不需要团队合作与协同工作。( )
单选题
数据产品的存在形式为数据集。( )
单选题
数据加工(Data Wrangling 或 Data Munging)的本质是将高层次数据转化为低层次数据的过程。( )
