相关题目
单选题
任何完整的大数据平台,一般包括以下的几个过程:数据采集à数据存储à数据处理à数据展现(可视化,报表和监控),其中,数据采集是所有数据系统必不可少的一个环节,随着大数据越来越被重视,数据采集的挑战也变的尤为突出。
单选题
批处理优先推荐使用Spark或SparkSQL模式,也可以便用MapReduce或出Hive模式。两种批处理模式可以同时使用。
单选题
每个DRS备份迁移实例最多支持10个标签配额。
单选题
列存表的辅助表CUDesc也是列存表。
单选题
离线批量的作业形式:可以通过例如HQL和SparkSQL的命令,也可以通过API编写代码,打包提交运行。
单选题
离线批处理,通常是指对海量数据进分析和处理,形成结果数据,供下一步数据应用使用,离线处速对处理时间要求不高。
单选题
仅空间管理员可审计用户权限,包含查看用户列表、回收用户权限、对用户进行授权。
单选题
分布式执行框架采用Producer-Consumer模型。
单选题
二级索引为Hbase提供了按照某些列的值进行索引的功能,二级索引先查表索引,在定位到数据表中的位置,不需要全表扫描。
单选题
对于大数据而言,最基本、最重要的要求就是减少错误、保证质量。因此,大数据收集的信息量要尽量精确。
