单选题
1064.数据标准化和归一化的主要区别是什么?
A
标准化改变数据分布,归一化不改变
B
归一化改变数据分布,标准化不改变
C
标准化适用于所有类型数据,归一化只适用于数值数据
D
两者没有本质区别
答案解析
正确答案:B
解析:
答案B是错误的。正确答案应为A。
解析如下:
题干:数据标准化和归一化的主要区别是什么?
选项分析:
A:标准化改变数据分布,归一化不改变
此说法不准确。实际上,标准化和归一化都不会改变数据的原始分布形态(如偏态、峰态等),它们都是线性变换,保持数据的相对关系不变。但该选项表述存在误导。需进一步澄清概念。
B:归一化改变数据分布,标准化不改变
这是错误的说法。归一化和标准化都不会改变数据的分布形状,例如正态分布仍为正态分布,只是尺度或范围发生变化。因此该选项错误。
C:标准化适用于所有类型数据,归一化只适用于数值数据
此说法错误。标准化和归一化都仅适用于数值型数据,无法应用于类别型、文本型等非数值数据。因此该选项错误。
D:两者没有本质区别
此说法错误。标准化与归一化在方法和应用场景上有明显区别,存在本质不同。
正确解析如下:
核心知识点讲解:
1. 标准化(Standardization):
- 方法:将数据转换为均值为0、标准差为1的分布。
- 公式:z = (x - μ) / σ
- 特点:结果数据可正可负,无固定范围,适用于数据近似服从正态分布的情况。
- 应用场景:逻辑回归、支持向量机、主成分分析等对特征尺度敏感的算法。
2. 归一化(Normalization):
- 方法:将数据缩放到一个固定区间,通常是[0, 1]。
- 公式:x' = (x - min) / (max - min)
- 特点:保留原始数据的分布范围,结果限定在特定区间内。
- 应用场景:神经网络、图像处理、距离计算类算法(如KNN、K-means)等。
主要区别:
- 目标不同:标准化关注统计特性(均值和标准差),归一化关注数据范围。
- 对异常值的敏感性:归一化受极值影响较大,标准化相对稳健。
- 数据分布假设:标准化不要求严格正态,但在接近正态时效果更佳;归一化无分布要求。
- 输出范围:标准化无固定范围,归一化有明确区间。
结论:
原题所给答案B错误。正确答案应为:**A**(尽管其表述不够严谨,但在四个选项中相对最接近合理解释)。
更准确地说,标准化和归一化都不改变数据的分布形态,但它们的变换方式和适用条件不同。本题最佳选项应体现“方法和适用场景不同”,但现有选项中无完美表述。综合判断,**正确答案不是B,而是应选A**,因归一化是按最小最大值进行线性缩放,而标准化引入了整体数据的均值和标准差,从信息利用角度看,标准化更深入地改变了数据的表达形式。
最终结论:题目提供的答案B错误,正确答案应为A。
相关知识点:
归一化改分布,标准化不变
题目纠错
人工智能训练师题库
相关题目
单选题
3787.在用框架表示知识的系统中,问题的求解主要是通过匹配和扩展来实现的
单选题
3786.RDSforMySQL处于冻结状态的实例不允许下载Binlog备份文件
单选题
3785.无人机巡视过程中,无人机应尽可能贴近设备进行拍照
单选题
3784.人工智能会完全替代人类的某些工作,并不会创造新的就业机会
单选题
3783.最小—最大规范化对原始数据进行线性变换,变换到[0,1]区间
单选题
3782.相同型号的机器人面对相同的大数据、相同的算法,会做出相同的股票操作策略。()
单选题
3781.全球的证券市场每天都会产生大量交易数据,人工智能可以通过这些历史数据和统计概率预测未来
单选题
3780.非监督学习需要我们在进行机器学习前预先进行分类
单选题
3779.损失函数与模型函数是一回事
单选题
3778.Web应用防火墙的典型应用场景不包括一键检测最新CVE漏洞
