单选题
1206.以下哪个评价指标用于衡量分类器的性能,尤其在不平衡数据集中?
A
准确率
B
F1分数
C
ROC曲线下面积
D
均方误差
答案解析
正确答案:C
解析:
题干分析:本题考查的是分类器性能评价指标,特别关注在不平衡数据集中的适用性。
选项解析:
A:准确率(Accuracy)
定义为分类正确的样本数占总样本数的比例。在类别分布平衡的情况下,准确率是一个有效的评价指标。但在不平衡数据集中,例如负类样本占99%,正类仅占1%,即使模型将所有样本预测为负类,准确率仍可达99%。这会严重误导模型性能的评估,因此准确率不适用于不平衡数据集。
B:F1分数(F1 Score)
是精确率(Precision)和召回率(Recall)的调和平均值,综合考虑了模型对正类的识别能力,在一定程度上适用于不平衡数据集。F1分数更关注少数类的分类效果,因此比准确率更适合此类场景。但其局限在于仅针对二分类且需设定分类阈值,且对类别权重变化较敏感。
C:ROC曲线下面积(AUC-ROC)
即受试者工作特征曲线下的面积,衡量分类器在不同阈值下区分正负类的能力。AUC值不依赖于具体的分类阈值,且对类别不平衡具有较强的鲁棒性,因为它分别使用真正例率(TPR)和假正例率(FPR),其中TPR反映召回能力,FPR基于负类总数归一化,使得即使负类样本远多于正类,也能有效评估模型性能。因此,AUC是衡量不平衡数据集中分类器性能的常用且可靠指标。
D:均方误差(Mean Squared Error, MSE)
是回归任务中的常用评价指标,用于衡量预测值与真实值之间的平方误差的均值。它不适用于分类问题,因此在此题中明显错误。
核心知识点讲解:
- 不平衡数据集:指各类别样本数量差异显著的数据集。此时,传统指标如准确率容易因多数类主导而失真。
- ROC曲线:以假正例率(FPR)为横轴,真正例率(TPR)为纵轴,描绘分类器在不同阈值下的表现。
- AUC:曲线下面积,取值范围在0.5到1之间。AUC越大,分类器整体判别能力越强。AUC=0.5表示无判别能力,AUC=1表示完美分类。
- 为什么AUC适合不平衡数据:因为FPR的分母是真实的负类样本数,TPR的分母是真实的正类样本数,二者均经过归一化处理,因此不受类别比例影响。
综上所述,正确答案为C:ROC曲线下面积。该指标能够全面、稳定地评估分类器在不平衡数据集中的性能表现。
相关知识点:
LSTM用于可变序列建模
题目纠错
人工智能训练师题库
相关题目
单选题
3645.当Subscriber接收到消息,会以通知服务机制来处理。
单选题
3644.rqt(graph可以看到所有的topic、service和action。
单选题
3643.rosbag可以记录和回放service。
单选题
3642.现在要设计一个节点,开发路径规划功能,输入是目标点和起始点,输出是路径,适合用Topic通信方式。
单选题
3641.机械臂关节逆解适合用Service通信。
单选题
3640.传感器消息发布一般都采用Topic形式发布。
单选题
3639.同一个Topic上可以有多个发布者。
单选题
3638.查看当前活跃的Topic可以通过rostopiclist命令。
单选题
3637.接受者成功收到消息后会回传给发布者确认信息。
单选题
3636.一个Node最多只能发布一个Topic。
