1206.以下哪个评价指标用于衡量分类器的性能,尤其在不平衡数据集中?

准确率

F1分数

ROC曲线下面积

均方误差

答案解析

正确答案：C

解析：

题干分析：本题考查的是分类器性能评价指标，特别关注在不平衡数据集中的适用性。选项解析： A：准确率（Accuracy）定义为分类正确的样本数占总样本数的比例。在类别分布平衡的情况下，准确率是一个有效的评价指标。但在不平衡数据集中，例如负类样本占99%，正类仅占1%，即使模型将所有样本预测为负类，准确率仍可达99%。这会严重误导模型性能的评估，因此准确率不适用于不平衡数据集。 B：F1分数（F1 Score）是精确率（Precision）和召回率（Recall）的调和平均值，综合考虑了模型对正类的识别能力，在一定程度上适用于不平衡数据集。F1分数更关注少数类的分类效果，因此比准确率更适合此类场景。但其局限在于仅针对二分类且需设定分类阈值，且对类别权重变化较敏感。 C：ROC曲线下面积（AUC-ROC）即受试者工作特征曲线下的面积，衡量分类器在不同阈值下区分正负类的能力。AUC值不依赖于具体的分类阈值，且对类别不平衡具有较强的鲁棒性，因为它分别使用真正例率（TPR）和假正例率（FPR），其中TPR反映召回能力，FPR基于负类总数归一化，使得即使负类样本远多于正类，也能有效评估模型性能。因此，AUC是衡量不平衡数据集中分类器性能的常用且可靠指标。 D：均方误差（Mean Squared Error, MSE）是回归任务中的常用评价指标，用于衡量预测值与真实值之间的平方误差的均值。它不适用于分类问题，因此在此题中明显错误。核心知识点讲解： - 不平衡数据集：指各类别样本数量差异显著的数据集。此时，传统指标如准确率容易因多数类主导而失真。 - ROC曲线：以假正例率（FPR）为横轴，真正例率（TPR）为纵轴，描绘分类器在不同阈值下的表现。 - AUC：曲线下面积，取值范围在0.5到1之间。AUC越大，分类器整体判别能力越强。AUC=0.5表示无判别能力，AUC=1表示完美分类。 - 为什么AUC适合不平衡数据：因为FPR的分母是真实的负类样本数，TPR的分母是真实的正类样本数，二者均经过归一化处理，因此不受类别比例影响。综上所述，正确答案为C：ROC曲线下面积。该指标能够全面、稳定地评估分类器在不平衡数据集中的性能表现。