多选题
如果希望减少数据集中的特征数量,则可以采取的措施有()。
A
使用正向选择法(Forward Selection)
B
使用反向消除法(Backward Elimination)
C
逐步选择消除法(Stepwise)
D
计算不同特征之间的相关系数,删去相关系数高的特征之一
答案解析
正确答案:ABCD
解析:
正向选择法(Forward Selection)是首先选择一个特征,每个特征都试一遍,选择对模型准确率提升最高的那个特征;然后再在这个特征基础上添加另外一个特征,方法类似,直到模型准确率不再提示为止。反向消除法(Backward Elimination)是首先包含了所有的特征,然后尝试删除每个特征,最终删掉对模型准确率提升最高的一个特征(如果删除这个特征模型准确率反而增加了,则说明这个特征是无用特征)。以此类推,直到删除特征并不能提升模型为止。相对于正向选择法,反向消除法的优点在于其允许一些低贡献值的特征能够进到模型中去(有时候低贡献值的特征能在组合中有更大的贡献值,而正向选择法忽略了这种组合的可能性),因此反向消除法能够避免受一两个占主导地位的特征的干扰。另外还有一种特征选择方法是逐步选择消除法(Stepwise),该方法结合上述两者的方法,新加入一个特征之后,再尝试删去一个特征,直至达到某个预设的标准。这种方法的缺点是预设的标准不好定,而且容易陷入到过拟合当中。除此之外,也可以使用基于相关性的特征选择,可以去除多重线性特征。
题目纠错
相关题目
单选题
os.path模块可以用来判断指定路径是否存在的函数是()。
单选题
()模块是Python标准库中最常用的模块之一。通过它可以获取命令行参数,从而实现从程序外部向程序内部传递参数的功能,也可以获取程序路径和当前系统平台等信息。
单选题
假设函数中不包括global保留字,对于改变参数值的方法,下列描述错误的是()。
单选题
下列程序执行后可以查看Python版本的是()。
单选题
在Python中可以通过调用random库来产生随机数。a=random.randint(1,99),并赋值给变量a,则下列描述正确的是()。
单选题
Python中用于生成随机数的模块是random,则下列描述错误的是()。
单选题
下列关于random.uniform(a,b)作用的描述正确的是()。
单选题
random库中用于生成随机小数的函数是()。
单选题
在Python中,导入random包后random.random()可能的运行结果为()。
单选题
random库的seed(a)函数的作用是()。
