ROC和RUC
学习器为测试样本产生一个实值或概率预测,然后将这个预测值与一个分类阈值进行比较,若大于阈值则分为正类,否则分为反类;
ROC(受试者工作特征 横轴-真正例率(TPR) 纵轴-假正例率(FPR))
TPR=TP/(TP+FN) FPR=FP/(TN + FP);
绘图过程:
给定m+个正例和m-个反例,根据学习器的预测结果对样例进行排序,然后把分类阈值设为最大,即把所有样例均预测为反例;
若为真正例,则上移1/m+单位;
若为假正例,则右移1/m-单位。
这样恰恰说明了为什么横轴就表示FPR,纵轴就表示TPR。
经过(m+ add m-)次的猜测,就得到从(0,0)到(1,1)的折线ROC。
对每个点作关于x,y轴的直线,将该区域分成 m+ mulpitly m- 块小矩形。
扫描二维码关注公众号,回复:
7698827 查看本文章
在ROC曲线之下的面积是AUC(Area Under ROC Curve)
经过(m+ add m-)次的猜测,就得到从(0,0)到(1,1)的折线ROC。
对每个点作关于x,y轴的直线,将该区域分成 m+ mulpitly m- 块小矩形。
,
思考:对于不同的排序而言会产生灰色区域的误差;因此需要考虑f(x+)=f(x-)的误差;
ROC曲线上方的面积等于m-块底为1/m-,高为1/m+ multiple (剩余的正例数目),并考虑排序带来的影响
故 得到书上的损失公式。