相关题目
假如我们使用非线性可分的 SVM 目标函数作为最优化对象, 我们怎么¥保证模型线性可分?( )
我们想在大数据集上训练决策树, 为了使用较少时间, 我们可以 : ¥( )
”点击率问题”是这样一个预测问题, 99%的人是不会点击的, 而 1%¥的人是会点击进去的, 所以这是一个非常不平衡的数据集. 假设, 现在我们¥已经建了一个模型来分类, 而且有了 99%的预测准确率, 我们可以下的结¥论是 : ( )
如果 SVM 模型欠拟合, 以下方法哪些可以改进模型 : ()
对于信息增益, 决策树分裂节点, 下面说法正确的是: ( ) 1.纯度高的节点需要更多的信息去区分¥2.信息增益可以用”1 比特-熵”获得¥3.如果选择一个属性具有许多归类值, 那么这个信息增益是有偏差的
模型的高 bias 是什么意思, 我们如何降低它 ?( )
回归模型中存在多重共线性, 你如何解决这个问题?¥1.去除这两个共线性变量¥2.我们可以先去除一个共线性变量¥3.计算 VIF(方差膨胀因子), 采取相应措施¥4.为了避免损失信息, 我们可以使用一些正则化方法, 比如, 岭回归和 lasso 回 归.¥以下哪些是对的:()
对于 k 折交叉验证, 以下对 k 的说法正确的是 :( )
“过拟合”只在监督学习中出现,在非监督学习中,没有”过拟合”,¥这是:( )
bootstrap 数据是什么意思?(提示:考“bootstrap”和¥“boosting”区别)( )
