AI智能推荐题库-试题通 AI智能整理导入题库-试题通
×
首页 题库中心 人工智能训练师题库 题目详情
CB6C09EC34E00001C0C418901FB11A1A
人工智能训练师题库
4,855
单选题

1206.以下哪个评价指标用于衡量分类器的性能,尤其在不平衡数据集中?

A
准确率
B
F1分数
C
ROC曲线下面积
D
均方误差

答案解析

正确答案:C

解析:

题干分析:本题考查的是分类器性能评价指标,特别关注在不平衡数据集中的适用性。 选项解析: A:准确率(Accuracy) 定义为分类正确的样本数占总样本数的比例。在类别分布平衡的情况下,准确率是一个有效的评价指标。但在不平衡数据集中,例如负类样本占99%,正类仅占1%,即使模型将所有样本预测为负类,准确率仍可达99%。这会严重误导模型性能的评估,因此准确率不适用于不平衡数据集。 B:F1分数(F1 Score) 是精确率(Precision)和召回率(Recall)的调和平均值,综合考虑了模型对正类的识别能力,在一定程度上适用于不平衡数据集。F1分数更关注少数类的分类效果,因此比准确率更适合此类场景。但其局限在于仅针对二分类且需设定分类阈值,且对类别权重变化较敏感。 C:ROC曲线下面积(AUC-ROC) 即受试者工作特征曲线下的面积,衡量分类器在不同阈值下区分正负类的能力。AUC值不依赖于具体的分类阈值,且对类别不平衡具有较强的鲁棒性,因为它分别使用真正例率(TPR)和假正例率(FPR),其中TPR反映召回能力,FPR基于负类总数归一化,使得即使负类样本远多于正类,也能有效评估模型性能。因此,AUC是衡量不平衡数据集中分类器性能的常用且可靠指标。 D:均方误差(Mean Squared Error, MSE) 是回归任务中的常用评价指标,用于衡量预测值与真实值之间的平方误差的均值。它不适用于分类问题,因此在此题中明显错误。 核心知识点讲解: - 不平衡数据集:指各类别样本数量差异显著的数据集。此时,传统指标如准确率容易因多数类主导而失真。 - ROC曲线:以假正例率(FPR)为横轴,真正例率(TPR)为纵轴,描绘分类器在不同阈值下的表现。 - AUC:曲线下面积,取值范围在0.5到1之间。AUC越大,分类器整体判别能力越强。AUC=0.5表示无判别能力,AUC=1表示完美分类。 - 为什么AUC适合不平衡数据:因为FPR的分母是真实的负类样本数,TPR的分母是真实的正类样本数,二者均经过归一化处理,因此不受类别比例影响。 综上所述,正确答案为C:ROC曲线下面积。该指标能够全面、稳定地评估分类器在不平衡数据集中的性能表现。

相关知识点:

LSTM用于可变序列建模

题目纠错
人工智能训练师题库

扫码进入小程序
随时随地练习

关闭登录弹窗
专为自学备考人员打造
勾选图标
自助导入本地题库
勾选图标
多种刷题考试模式
勾选图标
本地离线答题搜题
勾选图标
扫码考试方便快捷
勾选图标
海量试题每日更新
波浪装饰图
欢迎登录试题通
可以使用以下方式扫码登陆
APP图标
使用APP登录
微信图标
使用微信登录
试题通小程序二维码
联系电话:
400-660-3606
试题通企业微信二维码