相关题目
单选题
基于集中式架构,融合结构化、非结构化、海量历史 / 准实时和电网地理信息四类数据中心,整合、优化公司现有技术组件,构建公司级大数据平台。( )
单选题
数据质量管理工作是指建立数据质量检查规则并运用数据质量检查规则与技术手 段,对数据质量问题进行跟踪、检查、分析、评价、督促整改并定期进行数据质量通报评价等工作。( )
单选题
从数据流的视角看,数据产品的开发过程是一个数据加工(Data Wrangling 或 Data Munging)的过程。( )
单选题
数据体现业务本质和内涵,遵从业务的逻辑和关联关系,依据业务才能更好实现对数据的全寿命周期统一管理。( )
单选题
数据分析一般指用统计分析方法对收集来的少量数据进行分析,提取有用信息和形成结论而对数据加以详细研究和概括总结的过程。( )
单选题
离群点可以是合法的数据对象或者值。( )
单选题
类别不平衡就是指分类任务中相同类别的训练样例数目差别很大的情况。( )
单选题
信息熵是度量样本集合纯度最常用的一种指标,其值越小,表明样本集合的纯度越高。( )
单选题
诊断性分析是描述性分析的基础。( )
单选题
特征提取技术并不依赖于特定的领域。( )
