相关题目
在一个MapReduce应用程序中,map函数的输出经由MapReduce框架处理后,发送到reduce函数。这个处理过程是基于键值对进行排序和分组的。
在线迁移中可能因外部因素导致迁移暂时故障,用户根据迁移日志信息解决问题后,可以通过续传功能继续迁移。
在Spark中,累加器可以实现高速并行的计数器和变量求和;在Spark的应用程序开发过程中, 只有在Driver上获取此计数器的值。
在Spark中,SparkSQL是独立的模块,可以不依赖于SparkCore独立完成SQL 语句的解析、优化和执行等操作。
在MapReduce编程中,代码不仅要描述做什么,还要描述具体怎么做。
在Kafka中,Producer可以通过配置同步参数(producer.type),保证数据按顺序发送。
在IAM控制台创建用户组时,不应当授予数据复制服务管理员权限“DRS Administrator”权限。
在HDFS里,若打开其回收站机制,则删除文件时,文件不会立即真正被删除。
在Flume级联传输过程中,可以使用fail over模式传输,这样如果下一跳的Flume节点故障或 者数据接受异常时,可以自动切换到另外一路上继续传输。
在Flink中,checkpoint机制能够保证应用在运行过程中出现失败时,从某一个点恢复,在此过程中,流快照是根据数据流入顺序依次创建的。
