fasttext在二分类问题中,recall与precision值是相同的,why

通过研究fasttext官方文档(https://fasttext.cc/docs/en/supervised-tutorial.html)中的如下部分:

很容易发现此处的召回率与精确率与平常所计算的方式不同;这里是专门针对多标签而计算的;而且针对一条样本就可以计算出这两个值 ;图中实际标签为 equipment,cleaning,knives; 预测标签为food-safety,baking,equipment,substitutions,bread ; 只有equipment是正确的,1/5=0.2,即精确率;而召回率预测正确的标签数量除以真实的标签数量;1/3=0.33即recall;

按这种理论计算,由于分子是一样的,分母是不一样的;换句话说,如果分母相同,即标签数量相同,两个指标值就会相同;

对于二分类而言,每条样本而言,分母永远都是一样的,就是1;如果真实标签是spam,预测的标签也是spam,那么精确率为1,召回率也为1;如果预测标签是normal,则精确率为0,召回率也为0;所以两者值完全相同;

本质上而言,此处的recall是针对多标签设计的;对于 二分类单标签是没有意义的;

猜你喜欢

转载自blog.csdn.net/ningyanggege/article/details/88978592
今日推荐