相关题目
单选题
点击率的预测是一个数据比例不平衡问题(如训练集中样本呈阴性的比例为 99%, 阳性的比例是 1%),如果用这种数据建立模型并使得训练集的准确率高达 99%。则可以得出结论是( )。
单选题
一般而言,在个体学习器性能相差较大与个体学习器性能相近时宜分别使用( )。
单选题
可用作数据挖掘分析中的关联规则算法有( )。
单选题
下列关于 KNN 算法的过程:①计算训练样本和测试样本中每个样本点的距离(常见的距离度量有欧式距离、马氏距离等);②对上面所有的距离进行排序;③选前 k 个最小距离的样本;④根据这 k 个样本的标签进行投票,得到最后的分类类别。正确的排序为( )。
单选题
在 k 近邻学习算法中,随着 k 的增加,上界将逐渐降低,当 k 区域无穷大时,上界和下界碰到一起,k 近邻法就达到了( )。
单选题
KNN 近邻算法在( )的情况下效果较好。
单选题
( )不是 k 最近邻分类器的特点。
单选题
( )算法是分类算法。
单选题
下列算法中更适合做时间序列建模的是( )。
单选题
下列关于随机森林和 GBDT 的说法正确的是( )。
