相关题目
单选题
随机试验所有可能出现的结果称为( )。
单选题
采样分析的精确性随着采样随机性的增加而( ),但与样本数量的增加关系不大。
单选题
假如使用 Lasso 回归来拟合数据集,该数据集输入特征有 100 个(X1,X2,…, X100)。现在,把其中一个特征的值扩大 10 倍(如特征 X1),然后用相同的正则化参数对 Lasso 回归进行修正。那么下列说法正确的是( )。
单选题
点击率的预测是一个数据比例不平衡问题(如训练集中样本呈阴性的比例为 99%, 阳性的比例是 1%),如果用这种数据建立模型并使得训练集的准确率高达 99%。则可以得出结论是( )。
单选题
一般而言,在个体学习器性能相差较大与个体学习器性能相近时宜分别使用( )。
单选题
可用作数据挖掘分析中的关联规则算法有( )。
单选题
下列关于 KNN 算法的过程:①计算训练样本和测试样本中每个样本点的距离(常见的距离度量有欧式距离、马氏距离等);②对上面所有的距离进行排序;③选前 k 个最小距离的样本;④根据这 k 个样本的标签进行投票,得到最后的分类类别。正确的排序为( )。
单选题
在 k 近邻学习算法中,随着 k 的增加,上界将逐渐降低,当 k 区域无穷大时,上界和下界碰到一起,k 近邻法就达到了( )。
单选题
KNN 近邻算法在( )的情况下效果较好。
单选题
( )不是 k 最近邻分类器的特点。
