学习率衰减 Learning Rate Decay

其他 2019-01-12 02:32:32 阅读次数: 0

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/zpalyq110/article/details/81585990

Why should learning rate decay?

以目前最主流的参数优化算法Gradient Descent为例，为了让梯度下降的性能更优，我们需要将学习率设定在一个合适的范围。具体来说，学习率其实就是算法的步长，一步走多少决定了很多事情：步子大了，优化效率高，很可能一下越过最优解；相反，步子小了，优化效率低，很可能陷进一个局部最优解怎么都走不出来。所以学习率的调整在算法参数最优的过程中至关重要。

How decay learning rate?

exponential_decay:指数衰减
decayed_learning_rate = learning_rate * decay_rate ^ (global_step / decay_steps)
natural_exp_decay:自然指数衰减
decayed_learning_rate = learning_rate * exp(-decay_rate * global_step)
inverse_time_decay:逆时间衰减
decayed_learning_rate = learning_rate / (1 + decay_rate * global_step / decay_step)
polynomial_decay:多项式衰减
global_step = min(global_step, decay_steps)
decayed_learning_rate = (learning_rate - end_learning_rate) *(1 - global_step / decay_steps) ^ (power) + end_learning_rate

参数	意义
decayed_learning_rate	衰减后的学习率
learning_rate	初始学习率
decay_rate	衰减率
global_step	当前的step
decay_steps	衰减周期

猜你喜欢

转载自blog.csdn.net/zpalyq110/article/details/81585990

权重衰减（weight decay）与学习率衰减（learning rate decay）

学习率衰减 Learning Rate Decay

学习率衰减/learning rate decay

【转载】权重衰减（weight decay）与学习率衰减（learning rate decay）

学习率调整策略，学习率预热（warmup）和学习率衰减（Learning Rate Decay）

【深度学习】学习率预热和学习率衰减 (learning rate warmup & decay)

使用Pytorch实现学习率衰减/降低（learning rate decay）

pytorch learning rate decay

Deep learning II - II Optimization algorithms - learning rate decay 学习速率衰减

learning rate 和weight decay

《抛弃learning rate decay吧！》

Adam和学习率衰减（learning learning decay）

学习笔记一：learning rate,weight decay和momentum的理解

深度学习超参数——momentum、learning rate和weight decay

TensorFlow中的Learning rate decay介绍

学习率Learning rate

深度学习超参数简单理解learning rate,weight decay和momentum

深度学习超参数简单理解：learning rate,weight decay和momentum

深度学习概念、参数理解：iteration, batch_size, epoch, learning rate, weight_decay

深度学习超参数简单理解 learning rate,weight decay和momentum

深度学习超参数简单理解------ learning rate weight decay和momentum

[tensorflow] Tensorflow中learning rate 调整+ decay奇技淫巧

《Tensorflow 中 learning rate decay 的奇技淫巧》

学习速率 learning rate

机器学习之学习率 Learning Rate

深度学习: 学习率 (learning rate)

TensorFlow之二—学习率 (learning rate)

3.1 学习率（learning rate）的选择

学习率(Learning Rate) & 优化器(Optimizer)

Adaptive Learning Rate 自适应学习率

今日推荐

周排行

成为C++高手之宏与枚举

在CAD二次开发中使用进度条

Js插件ECharts，HighCharts学习网址整理

Celery提交任务出错(on windows.)

cephfs内核客户端性能追踪

thinkphp中PHPExcel用法

EntityFramework动态组合多排序字段

汇编语言（八）实验9 根据材料编程

安装ubuntu后必须做的事情（对我而言）

JS函数式编程

每日归档

更多

2024-10-22(0)

2024-10-21(0)

2024-10-20(0)

2024-10-19(0)

2024-10-18(0)

2024-10-17(0)

2024-10-16(0)

2024-10-15(0)

2024-10-14(0)

2024-10-13(0)