机器学习的常用评价指标总结

分类任务

TP (True Positive) 真正例: 被模型预测为正的正样本。

FP (False Positive) 假正例:被模型预测为正的假样本。

FN (False Negative) 假负例:被模型预测为负的正样本。

TN (True Negative) 真负例:被模型预测为负的负样本

准确度

 ​  Accuracy = \frac {n_{correct}}{n_{total}}

其中n_{correct}为被正确分类的样本个数,n_{total}为总样本的个数。

这个指标容易受到样本数量以及样本是否均衡带来的影响。

F1 score

精确率(Precision):指分别正确的正样本个数占分类器判定为正样本的样本个数的比例。

召回率(Recall):指分类正确的正样本个数占真正的正样本个数的比例。

F1 score 是精准率和召回率的调和平均值,

F1 = \frac {2 x precision x recall} {precision + recall}

RMSE

被用来衡量回归模型的好坏。

RMSE = \sqrt {\frac {\sum_{i=1}^n (y_{i} - \hat y_{i})^2} {n}}

其中,y_i是第i个样本点的真实值,\hat y_i是第i个样本点的预测值,n是样本点的个数。

一般情况下,RMSE能够很好地反映回归模型预测值与真实值的偏离程度。但在实际问题中,如果存在个别偏离程度非常大的离群点(Outlier)时,即使离群点数量非常少,也会让RMSE指标变得很差。

后面接着更新

猜你喜欢

转载自blog.csdn.net/jcl314159/article/details/119062632