相关题目
单选题
173.所谓数据清理,就是试图检测和去除数据集中的噪声数据和无关数据,处理遗漏数据,去除空白数据域和知 识背景下的白噪声,解决数据的一致性、唯一性问题,从而达到提高数据质量的目的。
单选题
172.HBase是一个分布式数据库,可以运行在不同的平台上。
单选题
171.Hadoop是基于Python语言开发的,具有很好的跨平台特性。
单选题
170.Spark Streaming提供了流计算。
单选题
169.DataV数据可视化是阿里云提供的分析并展示庞杂数据的产品。
单选题
168.最小-最大标准化方法和z-score规范化方法会保留原来数据中存在的关系。
单选题
167.关系数据库以关系模型作为数学理论基础的数据库。
单选题
166.Apriori算法可以适用于连续型属性。
单选题
165.MapReduce v2是在MapReduce v1基础上引入了YARN架构。
单选题
164.一个Spark应用被提交时,首先需要为这个应用构建起基本的运行环境SparkContext。
