sklearn中的merics


详解sklearn中的merics—超链接到sklearn官方文档

balanced accuracy

准确率的局限性:当负样本占 99% 时,分类器把所有样本都预测为负样本也可以获得 99% 的准确率。所以,当不同类别的样本比例非常不均衡时,占比大的类别往往成为影响精度的最主要因素。虽然模型的整体分类精度高,但不代表对占比小的类别的分类精度也高。

解决方案:平均精度——每个类别下的样本精度的算术平均。例如一个二分类问题,分类 0 共有 270 个样本,其中正确的有 240;分类 1 共有 30 个样本,其中正确的有 24。最终计算出的精度为 (240 + 24) / 300 = 0.88,而平均精度为 (240 / 270 + 24 / 30) / 2 = 0.844。可以看出在分类不均衡情况下,平均精度比精度更能反映客观情况。

from sklearn.metrics import balanced_accuracy_score
balanced_accuracy_score(target_test, model.predict(data_test))

评价指标 balanced accuracy

kappa 系数

Kappa系数
首先,我们介绍一下kappa系数:
kappa系数是用在统计学中评估一致性的一种方法,我们可以用他来进行多分类模型准确度的评估,这个系数的取值范围是[-1,1],实际应用中,一般是[0,1],与ROC曲线中一般不会出现下凸形曲线的原理类似。
这个系数的值越高,则代表模型实现的分类准确度越高。kappa系数的计算方法可以这样来表示:
在这里插入图片描述

发布了180 篇原创文章 · 获赞 309 · 访问量 27万+

猜你喜欢

转载自blog.csdn.net/xys430381_1/article/details/103987366