机器学习--评价指标:召回率、准确率、ROC曲线、AUC、PR曲线

(93) 2024-06-19 19:01:01

机器学习-评价指标:召回率、准确率、ROC曲线、AUC、PR曲线

  • 1. 混淆矩阵:
    • TP, FP, TN, FN
  • 2 准确率(Precision)
  • 3 召回率(Recall)
  • 4 ROC曲线
  • 5 AUU:ROC曲线下的面积
  • 6 PR曲线

1. 混淆矩阵:

机器学习--评价指标:召回率、准确率、ROC曲线、AUC、PR曲线 (https://mushiming.com/)  第1张

TP, FP, TN, FN

True Positives,TP:预测为正样本,实际也为正样本的特征数
False Positives,FP:预测为正样本,实际为负样本的特征数
True Negatives,TN:预测为负样本,实际也为负样本的特征数
False Negatives,FN:预测为负样本,实际为正样本的特征

2 准确率(Precision)

准确率描述的是预测为正的人当中有多少预测正确了, 计算公式如下:
机器学习--评价指标:召回率、准确率、ROC曲线、AUC、PR曲线 (https://mushiming.com/)  第2张

3 召回率(Recall)

召回率描述的是正样本中被预测准确的概率,也就是真正为正的人当中有多少被预测到了。
机器学习--评价指标:召回率、准确率、ROC曲线、AUC、PR曲线 (https://mushiming.com/)  第3张

4 ROC曲线

ROC曲线常用于二分类问题中的模型比较,主要表现为一种真正例率 (TPR) 和假正例率 (FPR) 的权衡。
x轴为假阳性(FPR),y轴为真阳性(TPR)。
机器学习--评价指标:召回率、准确率、ROC曲线、AUC、PR曲线 (https://mushiming.com/)  第4张

5 AUU:ROC曲线下的面积

ROC曲线围成的面积 (即AUC)可以解读为:从所有正例中随机选取一个样本A,再从所有负例中随机选取一个样本B,分类器将A判为正例的概率比将B判为正例的概率大的可能性。可以看到位于随机线上方的点(如图中的A点)被认为好于随机猜测。在这样的点上TPR总大于FPR,意为正例被判为正例的概率大于负例被判为正例的概率。

6 PR曲线

PR曲线是准确率和召回率的点连成的线。
PR曲线展示的是Precision vs Recall的曲线,PR曲线与ROC曲线的相同点是都采用了TPR (Recall),都可以用AUC来衡量分类器的效果。不同点是ROC曲线使用了FPR,而PR曲线使用了Precision,因此PR曲线的两个指标都聚焦于正例。类别不平衡问题中由于主要关心正例,所以在此情况下PR曲线被广泛认为优于ROC曲线。
参考链接
[1] https://www.imooc.com/article/48072
[2] 机器学习--评价指标:召回率、准确率、ROC曲线、AUC、PR曲线

THE END

发表回复