深度学习优化器Optimizer公式简记 - 代码天地

深度学习优化器Optimizer公式简记

其他 2020-04-12 11:58:18 阅读次数: 0

推荐学习资料：

[1] 从 SGD 到 Adam —— 深度学习优化算法概览(一)
[2] 深度学习——优化器算法Optimizer详解
[3] 一个框架看懂优化算法之异同 SGD/AdaGrad/Adam
[4] 什么是指数加权平均、偏差修正？

这里仅记录公式，方便对比记忆，而不解释由来，其他细节可以看上面说的资料。

设：

参数向量为 $\theta$
学习率为 $\eta$
用于数值稳定的接近0的常数 $\epsilon$
用于计算指数平均的接近1的常数 $\gamma$ 、 $\beta_1$ 、 $\beta_2$
在 $t$ 时刻损失函数对 $\theta$ 的梯度 $g_t=\nabla_\theta J(\theta)$
在 $t$ 时刻的一阶动量 $m_t$ ，根据 $\{g_1,g_2,\cdots,g_t\}$ 算出
在 $t$ 时刻的二阶动量 $v_t$ ，根据 $\{g_1^2,g_2^2,\cdots,g_t^2\}$ 算出，其中 $g_t^2=g_t \odot g_t$

梯度更新公式为：

$\theta_{t+1}=\theta_t-G_t \tag1$

各优化算法对 $G_t$ 的计算不同。

对于 SGD，

$G_t=\eta g_t \tag2$

对于 SGD with Momentum，

$G_t=\gamma G_{t-1}+\eta g_t \tag3$

对于 Adagrad，

$v_t=\sum_{i=1}^{t}g_i^2 \tag4$

$G_t=\frac{\eta}{\sqrt{v_t+\epsilon}}g_t \tag5$

对于 RMSprop，
$v_t=\gamma v_{t-1}+(1-\gamma)g_t^2 \tag6$

$G_t=\frac{\eta}{\sqrt{v_t+\epsilon}}g_t \tag7$

对于 Adam，

$m_t=\beta_1m_{t-1}+(1-\beta_1)g_t \tag8$

$v_t=\beta_2v_{t-1}+(1-\beta_2)g_t^2 \tag9$

$\hat m_t=\frac{m_t}{1-\beta_1^t} \tag{10}$

$\hat v_t=\frac{v_t}{1-\beta_2^t} \tag{11}$

$G_t=\frac{\eta}{\sqrt{\hat v_t+\epsilon}}\hat m_t \tag{12}$

pyxiea

发布了67 篇原创文章 · 获赞 27 · 访问量 7万+

私信关注

猜你喜欢

转载自blog.csdn.net/xpy870663266/article/details/104794371

深度学习优化器Optimizer公式简记

深度学习优化器 optimizer

深度学习——优化器Optimizer

深度学习优化器 optimizer 的选择

深度学习优化器 optimizer 的原理及选择

深度学习之:优化器 (optimizer)

关于深度学习优化器 optimizer 的选择

深度学习：常用优化器Optimizer简介

深度学习课程--assign2--optimizer优化器

优化方法公式及简记

关于深度学习优化器 optimizer 的选择，你需要了解这些

深度学习——优化器算法Optimizer详解（BGD、SGD、MBGD、Momentum、NAG、Adagrad、Adadelta、RMSprop、Adam）

PyTorch学习（9）—优化器（optimizer）

TensorFlow学习（5）优化器 Optimizer

学习率(Learning Rate) & 优化器(Optimizer)

优化器Optimizer

scipy优化器optimizer

Tensorflow 优化器（optimizer）

TensorFlow优化器optimizer

Optimizer 优化器

优化器 optimizer

optimizer优化器详解

Pytorch Optimizer优化器

优化器算法optimizer

优化器（Optimizer）（二）

优化器（Optimizer）（一）

深度学习领域常用optimizer总结-梯度下降算法优化

深度学习模型的构建三、优化函数optimizer

【深度学习】深入理解优化器Optimizer算法（BGD、SGD、MBGD、Momentum、NAG、Adagrad、Adadelta、RMSprop、Adam）

机器学习：各种优化器Optimizer的总结与比较

今日推荐

周排行

8种防盗链的方法

php的序列化和反序列化

Java 8：CompletableFuture

Android版本差异适配方案(5.0-9.0)

makedownpad使用

Spring Boot 使用AOP切面实现后台日志管理模块

实战SSM_O2O商铺_44【DES加密】关键配置信息进行DES加密

ACM排行榜说明

【转】SQL重复记录查询

板球和秃子威力那个大

每日归档

更多

2024-09-15(0)

2024-09-14(0)

2024-09-13(0)

2024-09-12(0)

2024-09-11(0)

2024-09-10(0)

2024-09-09(0)

2024-09-08(0)

2024-09-07(0)

2024-09-06(0)