关于正则惩罚L2 norm里w越小越好的一些另类思考 - 代码天地

关于正则惩罚L2 norm里w越小越好的一些另类思考

其他 2020-01-18 10:47:17 阅读次数: 0

以下全是本博主一派胡言，把深度学习看成是一种乐趣，而不是压力，在探索中，发现了很多乐趣：

一，现在通常用的激励函数，在input比较大的时候，不饱和，也就是分类效果好，而在input比较大的地方趋于饱和。w越小，就意味着input = wx+b比较小，也就是落在不饱和区的可能性更大，也就是更接近于线性。

二，黑色的直线显然比紫色的线泛华能力更好，黑色直线的w要小于紫色线的斜率。对于这种多分段的一个直观的激励函数就是maxout。这里其实也解释了为什么要w的平方，很明显有正有负吗。当然，用w的平方，使得导数里有w，也就是w越大，梯度越大，下降的越快。

可以联系SVM，SVM的目标函数就是w的L2 norm，约束条件反倒是y(wx+b)>=1，但是拉格朗日函数却是惊人的相似，只是目标函数变成了约束条件，约束条件变成了目标函数。 SVM就是要求||w||最小，其实也对应着一个对泛化能力的追求。而深度学习力的w的L2 norm越小，又可以类比于SVM的分类间隔最大。

becgiggs

发布了15 篇原创文章 · 获赞 6 · 访问量 4972

私信关注

猜你喜欢

转载自blog.csdn.net/becgiggs/article/details/82988776

关于正则惩罚L2 norm里w越小越好的一些另类思考

机器学习中L1和L2正则化的一些阐述

深度学习基础--正则化与norm--L2归一化、L2正则化、L2范数的区别

深度学习正则化(L1 norm/L2 norm)以及dropout理解

深度学习基础--正则化与norm--L1范数与L2范数的联系

L1、L2正则化；归一化与标准化

一文看懂L1、L2正则化的区别

深度学习正则化-参数范数惩罚（L1,L2范数）

批归一化（Batch Normalization）、L1正则化和L2正则化

BN和L2 NORM的区别

一文搞懂深度学习正则化的L2范数

权值衰减和L2正则化是一回事吗？

pytorch实现L2正则化code（一个简单的完整模型训练代码）

L2正则

Pytorch学习笔记（8）：正则化（L1、L2、Dropout）与归一化（BN、LN、IN、GN）

关于L1和L2正则

W3 - L2 - Regularization

L2范数归一化

L2范数惩罚项，高维线性回归

深度学习之正则化系列（1）：深入理解参数范数惩罚(L1正则化、L2正则化)原理及tensorflow实现

Tensorflow计算一个五层神经网络带L2正则化的损失函数

L2正则化

L2正则项

深度学习 --- 优化入门六（正则化、参数范数惩罚L0、L1、L2、Dropout）

L1,L2正则

范数（norm）：L-P，L0，L1，L2范数的简单介绍

通过集合计算一个5层神经网络带L2正则化的损失函数的计算方法

L2范数归一化定义

L2正则化的TnesorFlow实现

Kaldi中的L2正则化

今日推荐

周排行

Leetcode简单题61~80

解决zookeeper磁盘IO高的问题

多线程相关方法详解

Maven-setting.xml文件详解

Maven 项目的 classpath 理解

渊亭科技大数据笔试题

配置JVM内存分配

计算机网络个人学习笔记（三）网络层：第三部分连载

js中两个等号(==)和三个等号(===)的区别

用C程序自动打开电脑上的程序

每日归档

更多

2024-09-18(0)

2024-09-17(0)

2024-09-16(0)

2024-09-15(0)

2024-09-14(0)

2024-09-13(0)

2024-09-12(0)

2024-09-11(0)

2024-09-10(0)

2024-09-09(0)