单选题
762.mapreduce计算模型适用于哪种任务?
A
多线程处理
B
有关联的行处理
C
批处理
D
实时数据变化处理
答案解析
正确答案:C
解析:
题目解析:
题干:mapreduce计算模型适用于哪种任务?
选项分析:
A:多线程处理
多线程处理强调的是在单个计算节点上通过并发执行多个线程来提升性能。而MapReduce是一种分布式计算模型,其核心思想是将任务分布到多个节点上并行处理,而非依赖单一节点的多线程机制。因此该选项不符合MapReduce的主要应用场景。
B:有关联的行处理
MapReduce模型要求输入数据具有可分割性和独立性,通常假设数据行之间无强关联,以便能够并行处理。若数据行之间存在复杂依赖关系,MapReduce难以高效处理,因为这会引入额外的同步和通信开销。因此,有关联的行处理不是MapReduce的适用场景。
C:批处理
这是正确答案。MapReduce是一种面向大规模数据集的离线批处理模型。它通过将数据划分为块,在集群中分布式的进行Map(映射)和Reduce(归约)两个阶段处理,适合对静态、海量数据进行高吞吐量的批量计算,如日志分析、网页索引构建等典型应用。
D:实时数据变化处理
MapReduce设计用于处理静态存储的大规模数据,其执行周期较长,包含磁盘读写和中间结果持久化,不具备低延迟响应能力。因此不适用于需要实时响应的数据流处理任务。这类任务通常由流式计算框架如Flink、Storm或Spark Streaming来完成。
核心知识点讲解:
MapReduce 是由Google提出的一种编程模型,用于大规模数据集的并行处理。其核心思想是将计算过程抽象为两个主要阶段:
1. Map阶段:将输入数据拆分为键值对(key-value pairs),并应用用户定义的map函数生成中间键值对。
2. Reduce阶段:对中间结果按键进行聚合,应用用户定义的reduce函数得到最终输出。
该模型建立在“分而治之”的基础上,适用于具备以下特征的任务:
- 数据量大;
- 处理逻辑可以分解为映射和归约操作;
- 允许较高的延迟,即非实时;
- 数据访问模式为全量扫描而非随机访问。
因此,MapReduce最典型的适用场景是批处理任务。
综上所述,正确答案为 C:批处理。
相关知识点:
mapreduce,批处理任务行
题目纠错
人工智能训练师题库
相关题目
单选题
4089.[mydelete]、(mybase、$money和trigger1都是合法的标志符
单选题
4088.事务可用于保持数据的一致性,应避免在事务中进行人工输入输出操作
单选题
4087.ODBC、OLEDB、API和ADO.NET都是访问数据库系统的常用接口。
单选题
4086.SQLServer的字符型系统数据类型主要包括char、varchar、text和binary。
单选题
4085.关系数据模型能较好地表示实体间的1:1联系、1:n联系以及m:n联系。
单选题
4084.层次数据模型可以很好的表示多对多联系
单选题
4083.在综合分E-R图时,会出现属性冲突,结构冲突,命名冲突。
单选题
4082.函数依赖是多值依赖的一个特例
单选题
4081.标准SQL语言能用于所有类型的关系数据库系统。
单选题
4080.二级封锁协议能解决不可重复读问题,不能解决读"脏"数据。
