动量法 - 代码天地

动量法

其他 2021-01-24 20:25:05 阅读次数: 0

0. 前言

使用梯度下降法对神经网络进行优化时，会由于初始值选取得不好而陷入局部最优解；而动量方法就可以对其进行改进。

1. 动量法

普通梯度下降法：

$\theta_{t+1} \leftarrow \theta_t-\eta \nabla_{\theta} J(\theta_t)$
动量法：

$v_{t} \leftarrow ρv_{t-1}-\eta \nabla_{\theta} J(\theta_t)$
$\theta_{t+1} \leftarrow \theta_t+v_{t}$

$ρ$ 表示历史梯度的贡献率

主要思想：更新参数时将历史梯度信息考虑进去；
动量是惯性的来源，即通过 $t - 1$ 时刻和 $t$ 时刻来对 $t + 1$ 时刻产生共同的影响，相当于引入了一种惯性，这在一定程度上避免陷入局部最小值，落入以后大概率会被惯性甩出来

在这里插入图片描述
上图中对于下一步的走法就是，动量的方向和梯度的方向相结合。

Nesterov动量法

$v_{t} \leftarrow ρ v_{t-1}-\eta \nabla_{\theta} J(\theta_t+ρ v_{t-1})$
$\theta_{t+1} \leftarrow \theta_t+v_{t}$

在动量法的基础上改动的部分是梯度那里，即不再是关注当前的梯度，是先根据动量的方向走一步，再在此处看梯度方向，也就是在计算梯度时向前多看了一步，用图来表示就是：
在这里插入图片描述

猜你喜欢

转载自blog.csdn.net/weixin_41857483/article/details/111040732

动量法

动量优化法

pytorch学习：动量法momentum

通过移动平均理解动量法

优化算法optimization：SGD动量法momentum

3 动量与角动量

20221015 动量矩定理

深度学习优化函数详解（4）-- momentum 动量法

最优化算法Nesterov Momentum牛顿动量法

人工智能-优化算法之动量法

什么是动量效应和动量交易策略？

深度学习中的动量

python 动量指标

SGD的动量（Momentum）算法

日内动量交易策略

TidyQuant 动量策略

R：动量策略

（七）pytorch学习笔记---内容为学习资源摘录整合の梯度下降方法--动量法（2）

深度学习系列（七）优化算法（梯度下降、动量法、AdaGrad算法、RMSProp算法、AdaDelta算法、Adam算法） 2020.6.24

我室友打了两把csgo就搞懂了梯度，梯度下降，随机梯度下降(SGD)，动量法，ADAM

单因子动量概率模型

动量参数开合模型

随机梯度下降与动量详解

Momentum（动量）方法的python实现

动量Momentum梯度下降算法

动量梯度下降法详解

机械臂的广义动量

20230212 投影在动作标系的力矩和动量矩之间的关系

神经网络中的优化算法(BGD、SGD、MBGD、动量(Momentum)、NAG、Adagrad、AdaDelta、Adam、AMSGrad、牛顿法)、如何选择神经网络的优化算法

双因子动量过滤模型

今日推荐

周排行

AIZU 2224 Save your cats(并查集)

HTTP响应头状态码详解

Python socket编程（2）

MaxCompute Studio使用心得系列7—作业对比

Supervisor安装使用

LeetCode 164. Maximum Gap

mysql面试题: 一张表里面有ID自增主键，当insert了17条记录之后，删除了第15,16,17条记录，再把mysql重启，再insert一条记录，这条记录的ID是18还是15

nutch1.2 DeleteDuplicates IndexMerger 详解

OC - @property与setter,getter方法

SpringBoot @Transactional的rollbackFor属性

每日归档

更多

2024-09-19(0)

2024-09-18(0)

2024-09-17(0)

2024-09-16(0)

2024-09-15(0)

2024-09-14(0)

2024-09-13(0)

2024-09-12(0)

2024-09-11(0)

2024-09-10(0)