相关题目
()中期,“统计学习”闪亮登场并迅速占据主流舞台,代表性技术是支持向量机以及更一般的“核方法”。
假设我们要解决一个二类分类问题,我们已经建立好了模型,输出是0或1,初始时设阈值为05,超过05概率估计,就判别为1,否则就判别0;如果我们现在用另一个大于05的阈值,那么现在关于模型说法,正确的是?1模型分类的召回率会降低或不变2模型分类的召回率会升高3模型分类准确率会升高或不变 4模型分类准确率会降低
对于k折交叉验证,以下对k的说法正确的是?
以下哪些算法是分类算法?
我们想要减少数据集中的特征数,即降维。选择以下适合的方案①使用前向特征选择方法②使用后向特征排除方法③我们先把所有特征都使用,去训练一个模型,得到测试集上的表现然后我们去掉一个特征,再去训练,用交叉验证看看测试集上的表现,如果表现比原来还要好,我们可以去除这个特征④查看相关性表,去除相关性最高的一些特征
下面对集成学习模型中的弱学习器描述错误的是?
在有监督学习中,我们如何使用聚类方法?①我们可以先创建聚类类别,然后在每个类别上用监督学习分别进行学习②我们可以使用聚类“类别id”作为一个新的特征项,然后再用监督学习分别进行学习③在进行监督学习之前,我们不能新建聚类类别④我们不可以使用聚类“类别id”作为一个新的特征项,然后再用监督学习分别进行学习
一个完整机器学习项目需要以下哪些流程?①抽象成数学问题②获取数据③特征预处理与特征选择④训练模型与调优⑤模型诊断与融合⑥上线运行
()预测是正类的样本中,真正为正类的样本所占预测是正类的样本的比例;()在真实的正类的样本中,被预测出是正类的样本所占的比例。
降维算法是减少构建模型所需计算时间的方法之一。
