相关题目
假设我们有一个数据集,在一个深度为 6 的决策树的帮助下,它可以¥使用 100% 的精确度被训练。现在考虑一下两点,并基于这两点选择正确¥的选项。( )¥注意:所有其他超参数是相同的,所有其他因子不受影响。¥1.深度为 4 时将有高偏差和低方差¥2.深度为 4 时将有低偏差和低方差
为了得到和 SVD 一样的投射(projection),你需要在 PCA 中怎¥样做?( )
给定三个变量 X,Y,Z。(X, Y)、(Y, Z) 和 (X, Z) 的 Pearson 相¥关性系数分别为 C1、C2 和 C3。现在 X 的所有值加 2(即 X+2),Y ¥的全部值减 2(即 Y-2),Z 保持不变。那么运算之后的 (X, Y)、(Y, Z) ¥和 (X, Z) 相关性系数分别为 D1、D2 和 D3。现在试问 D1、D2、D3 ¥和 C1、C2、C3 之间的关系是什么?( )
最出名的降维算法是 PAC 和 t-SNE。将这两个算法分别应用到数据¥「X」上,并得到数据集「X_projected_PCA」,¥「X_projected_tSNE」。下面哪一项对「X_projected_PCA」和¥「X_projected_tSNE」的描述是正确的?( )
如果在一个高度非线性并且复杂的一些变量中“一个树模型可比一般的¥回归模型效果更好”是( )
对于线性回归模型,包括附加变量在内,以下的可能正确的是 :( )¥1.R-Squared 和 Adjusted R-squared 都是递增的¥2.R-Squared 是常量的,Adjusted R-squared 是递增的¥3.R-Squared 是递减的, Adjusted R-squared 也是递减的¥4.R-Squared 是递减的, Adjusted R-squared 是递增的
变量选择是用来选择最好的判别器子集, 如果要考虑模型效率,我们¥应该做哪些变量选择的考虑? ()¥1.多个变量其实有相同的用处¥2.变量对于模型的解释有多大作用¥3.特征携带的信息¥4.交叉验证
下面的交叉验证方法 :( )¥i. 有放回的 Bootstrap 方法¥ii. 留一个测试样本的交叉验证¥iii. 5 折交叉验证¥iv. 重复两次的 5 折交叉验证¥当样本是 1000 时,下面执行时间的顺序,正确的是:
如果一个训练好的模型在测试集上有 100%的准确率, 这是不是意味¥着在一个新的数据集上,也会有同样好的表现?( )
以下说法正确的是 :()¥1.一个机器学习模型,如果有较高准确率,总是说明这个分类器是好的¥2.如果增加模型复杂度, 那么模型的测试错误率总是会降低¥3.如果增加模型复杂度, 那么模型的训练错误率总是会降低¥4.我们不可以使用聚类“类别 id”作为一个新的特征项, 然后再用监督学¥习分别进行学习
