如果是简单的二分类任务,分类出来的结果有四种,其中有可能出现两种错误的结果:
1.FP(False positive)本来是反例,模型将其预测为正例。
2.FN(False negative)本来是正例,模型将其预测为反例。
例如:如果我们认为患新冠为正例,没患新冠为反例。
有这么一个人,他本来是没患新冠的,结果核酸检测(模型)将其测为阳性,这就是一个FP。
有这么一个人,他本来是患新冠的,结果核酸检测(模型)将其测为阴性,这就是一个FN。
其实说到这里就可以发现了,在新冠肺炎检测这个场景下,FP肯定是要比FN要好一些的。
引入精确率(查准率)和召回率(查全率)
精 确 率 = T P T P + F P 精确率 = \frac{TP}{TP+FP} 精确率=TP+FPTP
召 回 率 = T P T P + F N 召回率 = \frac{TP}{TP+FN} 召回率=TP+FNTP
通过公式可以发现,如果想使精确率提升,那么FP越少越好。还是以核酸检测为例子,也就是说只要我检测出来是阳性的,我都希望他真的是阳性,这可以反映出我的检测能力。但众所周知,查准其实在疫情环境下用处不太大,查全才是最关键的(希望尽可能多的查找出阳性,误诊也没事)。
疑罪从无–查准率高
宁错抓一千,不放过一个–查全率高