版权声明:署名,允许他人基于本文进行创作,且必须基于与原先许可协议相同的许可协议分发本文 (Creative Commons)
混淆矩阵(Confusion Matrix)
百度百科:
混淆矩阵也称误差矩阵,是表示精度评价的一种标准格式,用n行n列的矩阵形式来表示。
看完混淆矩阵中的TN,TP,FN,FP以及召回率、精度的表达式,有点糊涂。参考了若干张混淆矩阵图,制作一张“图示:
注:
-
根据预测情况和真实情况的对比,把全体样本分布到四个象限内(存在 个类别时,混淆矩阵有 个象限组成);
-
每个象限的名称,如TP,表示TruePositive,True表示预测结果是正确的,Positive表示预测中该样本是正例,如下图所示:
-
各个比率都是指预测正确的情况(绿色底纹部分),在所在行/列的占比。
-
不管几个类别的混淆矩阵,只有对角线是正确的(预测结果与实际一致,简单记为仅对角线是绿色)
recall/precision tradeoff
应当recall和precision都取最大值时,性能最佳。但两者有此消彼长的现象,因此引入调和平均数(harmonic mean)
:
相比于算数平均数,调和平均数可以为较低的值更大的权重。
- 如图显然三条曲线相交于同一点