【机器学习必知必会】损失函数与风险函数 - 代码天地

【机器学习必知必会】损失函数与风险函数

其他 2019-06-16 14:46:39 阅读次数: 0

引入

我们需要一定的准则来评估不同机器学习模型的优劣，这就引申出损失函数和风险函数。
损失函数：评估模型单次预测的好坏
风险函数：度量平均意义下模型的好坏

损失函数的定义

监督学习是在假设空间 $F$ 中选取模型 $f$ 作为决策函数，对于给定的输入 $X$ ，由 $f(X)$ 给出相应的输出 $Y$ ，用损失函数来衡量预测值 $f(X)$ 和真实值 $Y$ 之间的差距，它是一个非负实值函数，记作 $L(Y,f(X))$ 。

常用的损失函数

1. 0-1损失函数

$L(Y,f(x))= \begin{cases} 1, Y!=f(x) \\ 0, Y = f(x) \end{cases}$

2. 平方损失函数

$L(Y,f(X))=(Y-f(X))^2$

3. 绝对损失函数

$L(Y,P(Y|X))=|Y-f(X)|$

4. 对数似然损失函数

$L(Y,P(Y|X))=-logP(Y|X)$

风险函数

当损失函数越小时意味着模型拟合效果越好，损失函数的期望是：

$R_{exp}(f)=E_p[L(Y,f(x))]=\int_{x\times y}L(y,f(x))P(x,y)dxdy$
这是理论上模` $f(X)$ 关于联合分布 $P(X,Y)$ 的平均意义下的损失，称为风险函数（或者期望损失）。

风险函数与监督学习的关系

监督学习的目的就是选择令期望风险最小化的模型，但是由于联合分布 $P(X,Y)$ 未知，风险函数的值并不能直接计算，所以监督学习就称为一个病态问题（ill-formed problem）。

经验风险损失

由于风险函数并不能直接计算，我们转而求模型 $f(X)$ 在训练数据集上的平均损失作为经验风险损失，记作 $R_{emp}$ 。
$R_{emp}(f)=\frac{1}{N}\sum_{i=1}^{N}L(y_i,f(x_i))$

$R_{exp}(f)$ 是模型 $f(x)$ 关于联合分布的期望损失， $R_{emp}(f)$ 是模型 $f(x)$ 在训练集上的平均损失。根据大数定律，当样本容量 $N$ 趋于无穷是，这两个损失基本相等。但是现实中训练样本数量往往有限，从而用经验风险估计期望风险往往并不理想，需要对经验风险进行一定的矫正，这就涉及到监督学习的两个基本策略：经验风险最小化和结构风险最小化。

经验风险最小化

经验风险最小化策略认为，经验风险最小的模型就是最优的模型，即：

$\min_{f\in F} \frac{1}{N}\sum_{i=1}^{N}L(y_i,f(x_i))$
当样本容量足够大时，经验风险最小化能保证具有较好的学习效果，在现实中也被广泛采用。例如极大似然估计就是经验风险最小化的一个例子（在模型是条件概率分布，损失函数是对数损失函数时等价）。

结构风险最小化

当样本容量较小时，经验风险最小化的准则会导致过拟合问题的出现，结构风险最小化等价于正则化（也叫做罚项）。定义如下：

$R_{srm}=\frac{1}{N}L(y_i,f(x_i))+\lambda J(f)$
其中 $J(f)$ 为模型的复杂度，是定义在假设空间 $F$ 上的泛函。其中 $\lambda\geq0$ 是系数，用于权衡经验风险和模型复杂度对模型优劣的影响。

结构风险较小的模型往往对训练数据以及未知的测试数据都有较好的预测。例如贝叶斯估计中的最大后验概率估计就是结构风险最小化的例子（在模型是条件概率分布，损失函数是对数损失概率且模型复杂度由模型的先验概率表示时等价）。

结论

监督学习的问题可以转化为经验风险或者结构风险函数的最优化问题，这时候经验或者结构风险函数就是最优化的目标函数。

内容来源

《统计学习方法》——李航

猜你喜欢

转载自blog.csdn.net/TOMOCAT/article/details/91350932

【机器学习必知必会】损失函数与风险函数

机器学习之损失函数与风险函数

机器学习基础——损失函数与风险函数

机器学习从业者必知的5种回归损失函数

机器学习——损失函数，风险函数，误差，模型选择方法

【机器学习必知必会】交叉验证

SQL 必知必会--函数篇

SQL必知必会——分组函数（十）

MySQL必知必会——函数的使用

损失函数与风险函数

机器学习损失函数

机器学习-损失函数

机器学习（一）：监督学习、损失函数与风险函数、经验风险最小化与结构风险最小化

机器学习：损失函数、经验风险最小化、结构风险最小化

sql必知必会学习记录（八）- 数据处理函数

【机器学习必知必会】正则化和范数

ES6必知必会（八）—— async 函数

mysql必知必会读书笔记——函数

数学必知必会----极限与连续函数

mysql必知必会----11.使用函数

SQL必知必会——使用函数处理数据(八)

mysql必知必会--使用数据处理函数

MySQL必知必会十一：使用数据处理函数

JDK 8中重要的函数式接口（必知必会）

《MySQL必知必会》第2篇：常用函数

【MySQL必知必会(八)】【使用数据处理函数】

mysql必知必会的学习

机器学习面试—损失函数

机器学习中的损失函数

机器学习常用损失函数

今日推荐

周排行

深度学习------Lingvo框架下的加速通道GPipe

webjars管理静态资源

C专家编程_2.2

mysql 源码安装

json文件操作

123231432

注解的实现

Spring MVC 控制器

《人月神话》读后感二

C#使用HttpWebRequest和HttpWebResponse上传文件示例

每日归档

更多

2024-09-08(0)

2024-09-07(0)

2024-09-06(0)

2024-09-05(0)

2024-09-04(0)

2024-09-03(0)

2024-09-02(0)

2024-09-01(0)

2024-08-31(0)

2024-08-30(0)