二分类问题混淆矩阵和相关参数

混淆矩阵

预测的类
+ -
实际的类 + f + + ( T P ) f + ( F N )
- f + ( F P ) f ( T N )

相关术语:

TPFN

  • 真正 ( t r u e   p o s i t i v e   , T P ) 或者 f + + ,对应于被分类模型正确预测的正样本数。
  • 假负 ( f a l s e   n e g a t i v e   , F N ) 或者 f + ,对应于被分类模型错误预测为负类的正样本数
  • 假正 f a l s e   p o s i t i v e   , F P 或者 f + ,对应于被分类模型错误预测为正类的负样本数
  • 真负 t u r e   n e g a t i v e   , T N 或者 f ,对应于被分类模型正确预测的负样本数

其他术语

真正率(true positive rate,TPR)

或者称灵敏度(sensitivity)
定义为被模型正确预测的正样本的比例,即:

T P R = T P T P + F N

真负率(ture negative rate,TNR)

或者称特指率(specificity)
定义为被模型正确预测的负样本的比例,即:

T N R = T N T N + F P

假正率(false positive rate,FPR)

定义为被预测为正类的负样本比例,即:

F P R = F P T N + F P

假负率(false negative rate,FNR)

定义为被预测为负类的正样本的比例,即:

F N R = F N T P + F N

召回率(recall)

度量被分类器正确预测的正样本的比例,即:

r e c a l l = T P T P + F N

精度(precision)

精度确定分类器断言为正类的部分实际为正类记录所占的比例,即:

p r e c i s i o n = T P T P + F P

F 1 度量

精度和召回率可以合并为一个度量,称为 F 1 度量
原则上 F 1 为召回率和精度的调和均值

F 1 = 2 1 r + 1 p

一个高的 F 1 度量值确保精度和召回率都比较高。

猜你喜欢

转载自blog.csdn.net/uncle_gy/article/details/80379960
今日推荐