相关题目
单选题
机器学习为数据科学中充分发挥计算机的自动数据处理能力,拓展人的数据处理能力以及实现人机协同数据处理提供了重要手段。( )
单选题
对遗漏数据的处理方法主要有忽略该条记录,手工填补遗漏值,利用默认值填补遗漏值,利用均值填补遗漏值,利用同类别均值填补遗漏值,利用最可能的值填充遗漏值。( )
单选题
基于大数据的数据真实性分析技术能够提高垃圾信息的鉴别能力。( )
单选题
建立数据仓库的过程一般包括清洗、抽取数据操作,统一数据格式,设定自动程序以定时抽取操作数据并自动更新数据仓库,预先执行合计计算等步骤。( )
单选题
大数据分析是对总体数据,尤其是针对传统手段捕捉到的数据之外的非结构化数据进行分析。( )
单选题
数据类型的多样性往往导致数据的同质性,进而加大数据处理的复杂性。( )
单选题
数据科学是根据数据世界的分析结果,对现实世界进行预测、洞见、解释或决策的新兴科学。( )
单选题
数据科学流程的特殊性在于需要将科学家的 3C 精神融入业务流程之中。( )
单选题
分布式数据库是指物理上分散在不同的地点,但在逻辑上是统一的数据库。因此,分布式数据库具有物理上的独立性、逻辑上的一体性、性能上的可扩展性等特点。( )
单选题
非结构化数据是可以直接用传统关系数据库存储和管理的数据。( )
