统计学习笔记2

策略:

  • 考虑按什么准则学习或选择最优的模型
损失函数:

度量模型一次预测的好坏,有以下几种:
在这里插入图片描述
由于输入输出(X,Y)为随机变量,且为联合分布,因此其期望是:
在这里插入图片描述
统计学习的目标就是选择期望风险最小的模型,由于联合分布P(X,Y)未知,不能直接计算;我们选择用经验风险估计期望风险;由大数定理可知,当样本规模足够大的时候,经验风险将趋于期望风险;但由于实际的样本量往往无法达到要求,需要对经验风险进行矫正,下面将介绍“经验风险最小化”与"结构风险最小化“两种基本策略

经验风险最小化:

经验风险最小化的策略认为,经验风险最小的模型是最优模型
在这里插入图片描述
当样本足够大的时候,经验风险最小化效果显著,如极大似然估计;但样本数据较少时,可能会出现”过拟合“现象;为解决这一问题,我们引入”结构风险最小化“策略。

结构风险最小化:

在”经验风险最小化“的基础上加上正则化项(罚项)
在这里插入图片描述
J(f)是模型复杂度,模型越复杂,J(f)越大,反之越小;
如:最大后验概率估计
”结构风险最小化“策略认为结构风险最小的模型为最优模型
在这里插入图片描述
现在,监督学习问题就变成了”经验风险“或”结构风险“最小化问题

猜你喜欢

转载自blog.csdn.net/weixin_43264420/article/details/83793387