sklearn中的merics

balanced accuracy

准确率的局限性：当负样本占 99% 时，分类器把所有样本都预测为负样本也可以获得 99% 的准确率。所以，当不同类别的样本比例非常不均衡时，占比大的类别往往成为影响精度的最主要因素。虽然模型的整体分类精度高，但不代表对占比小的类别的分类精度也高。

解决方案：平均精度——每个类别下的样本精度的算术平均。例如一个二分类问题，分类 0 共有 270 个样本，其中正确的有 240；分类 1 共有 30 个样本，其中正确的有 24。最终计算出的精度为 (240 + 24) / 300 = 0.88，而平均精度为 (240 / 270 + 24 / 30) / 2 = 0.844。可以看出在分类不均衡情况下，平均精度比精度更能反映客观情况。

from sklearn.metrics import balanced_accuracy_score
balanced_accuracy_score(target_test, model.predict(data_test))

评价指标 balanced accuracy

kappa 系数

Kappa系数
首先，我们介绍一下kappa系数：
kappa系数是用在统计学中评估一致性的一种方法，我们可以用他来进行多分类模型准确度的评估，这个系数的取值范围是[-1,1]，实际应用中，一般是[0,1]，与ROC曲线中一般不会出现下凸形曲线的原理类似。
这个系数的值越高，则代表模型实现的分类准确度越高。kappa系数的计算方法可以这样来表示：
在这里插入图片描述

xys430381_1

发布了180 篇原创文章 · 获赞 309 · 访问量 27万+

私信关注

目录

balanced accuracy

kappa 系数

猜你喜欢