相关题目
单选题
类别不平衡就是指分类任务中相同类别的训练样例数目差别很大的情况。( )
单选题
信息熵是度量样本集合纯度最常用的一种指标,其值越小,表明样本集合的纯度越高。( )
单选题
诊断性分析是描述性分析的基础。( )
单选题
特征提取技术并不依赖于特定的领域。( )
单选题
数据预处理在实际的数据挖掘项目中是花费时间最长也是最为烦琐的步骤。( )
单选题
数据挖掘的目的是发现数据集中的模式或规律,数据挖掘有监督学习和无监督学习两种方式。( )
单选题
通常把分类错误的样本数量与分类正确样本数量的比例称为错误率。( )
单选题
二次指数平滑法有多期预测能力,短期预测效果较好。( )
单选题
机器学习为数据科学中充分发挥计算机的自动数据处理能力,拓展人的数据处理能力以及实现人机协同数据处理提供了重要手段。( )
单选题
对遗漏数据的处理方法主要有忽略该条记录,手工填补遗漏值,利用默认值填补遗漏值,利用均值填补遗漏值,利用同类别均值填补遗漏值,利用最可能的值填充遗漏值。( )
