机器学习 l1 相比于 l2 为什么容易获得稀疏解？ - 代码天地

机器学习 l1 相比于 l2 为什么容易获得稀疏解？

其他 2018-05-17 12:38:54 阅读次数: 2

此部分博客是我在知乎上摘录下来的，感谢知乎大神的用心回答。

一、通俗易懂的解释

作者：王赟 Maigo
链接：https://www.zhihu.com/question/37096933/answer/70426653
来源：知乎
著作权归作者所有。商业转载请联系作者获得授权，非商业转载请注明出处。

假设费用函数 L 与某个参数 x 的关系如图所示：

则最优的 x 在绿点处，x 非零。

现在施加 L2 regularization，新的费用函数（ $L + Cx^2$ ）如图中蓝线所示：

最优的 x 在黄点处，x 的绝对值减小了，但依然非零。

而如果施加 L1 regularization，则新的费用函数（ $L + C|x|$ ）如图中粉线所示：

最优的 x 就变成了 0。这里利用的就是绝对值函数的尖峰。

两种 regularization 能不能把最优的 x 变成 0，取决于原先的费用函数在 0 点处的导数。
如果本来导数不为 0，那么施加 L2 regularization 后导数依然不为 0，最优的 x 也不会变成 0。
而施加 L1 regularization 时，只要 regularization 项的系数 C 大于原先费用函数在 0 点处的导数的绝对值，x = 0 就会变成一个极小值点。

上面只分析了一个参数 x。事实上 L1 regularization 会使得许多参数的最优值变成 0，这样模型就稀疏了。

二、公式化的一般解释（这部分也是参考的知乎上的，作者十方）

设原先的损失函数是C0，那么在L0和L1条件下的损失函数对参数w求导得到：

猜你喜欢

转载自blog.csdn.net/dulingtingzi/article/details/80312362

机器学习 l1 相比于 l2 为什么容易获得稀疏解？

l1 相比于 l2 为什么容易获得稀疏解？

为什么L1正则化比L2正则化更容易获得稀疏解

l1约束比l2约束更容易获得稀疏解

机器学习知识点总结 - 为什么L1正则化比L2正则化更稀疏

为什么L1稀疏，L2平滑？

机器学习 - 正则化L1 L2

机器学习之L1 L2

机器学习L1、L2正则

Spark2.0机器学习系列之12：线性回归及L1、L2正则化区别与稀疏解

问题2 机器学习篇正则化L1和L2有什么区别？

机器学习中L1正则化和L2正则化有什么区别？

机器学习------L1、L2规范化（L1 Regularization、L1 Regularization）

L1比L2更稀疏

机器学习——L0、L1、L2范数

机器学习中L0, L1, L2正则项介绍

L0、L1、L2范数在机器学习中的应用

机器学习正则化之L0、L1与L2范数

L1和L2正则化。L1为什么能产生稀疏值，L2更平滑

L1 L2正则的讲解机器学习中正则化项L1和L2的直观理解

机器学习之路： python线性回归过拟合 L1与L2正则化

机器学习中正则化项L1和L2的直观理解

机器学习中正则化项L1和L2的绘图+理解

机器学习中的L1和L2正则化技术概述

（通俗理解）机器学习中 L1 和 L2 正则化的直观解释

机器学习中L1正则化和L2的区别

机器学习中的L1和L2正则化项

【笔记】机器学习里的各种LOSS（L1，L2）

【机器学习】好想彻底搞明白L1/L2正则

【机器学习】贝叶斯角度看L1，L2正则化

今日推荐

周排行

LRU cache算法

windows10, 自带的OpenSSH, key权限问题, 文件权限问题

测试用例书写方法

HIVE-默认分隔符的（linux系统的特殊字符）查看，输入和修改

最贵的AMD 7nm显卡来了！这设计够狂野

java多线程简单demo

[ 转载 ]在Android系统上使用busybox——最简单的方法

QT connect学习

BFSIFT算法分析

Xcode10：library not found for -lstdc++.6.0.9 临时解决

每日归档

更多

2024-08-06(0)

2024-08-05(0)

2024-08-04(0)

2024-08-03(0)

2024-08-02(0)

2024-08-01(0)

2024-07-31(0)

2024-07-30(0)

2024-07-29(0)

2024-07-28(0)