分类任务
TP (True Positive) 真正例: 被模型预测为正的正样本。
FP (False Positive) 假正例:被模型预测为正的假样本。
FN (False Negative) 假负例:被模型预测为负的正样本。
TN (True Negative) 真负例:被模型预测为负的负样本
准确度
其中为被正确分类的样本个数,为总样本的个数。
这个指标容易受到样本数量以及样本是否均衡带来的影响。
F1 score
精确率(Precision):指分别正确的正样本个数占分类器判定为正样本的样本个数的比例。
召回率(Recall):指分类正确的正样本个数占真正的正样本个数的比例。
F1 score 是精准率和召回率的调和平均值,
RMSE
被用来衡量回归模型的好坏。
其中,是第个样本点的真实值,是第个样本点的预测值,是样本点的个数。
一般情况下,RMSE能够很好地反映回归模型预测值与真实值的偏离程度。但在实际问题中,如果存在个别偏离程度非常大的离群点(Outlier)时,即使离群点数量非常少,也会让RMSE指标变得很差。
后面接着更新