bp算法中梯度消失 - 代码天地

bp算法中梯度消失

编程语言 2018-08-29 00:58:43 阅读次数: 0

主要是因为以前用sigmoid的时候，sigmoid中心部位和两侧的梯度差别太大，如果权重初始化得太大，激活值基本都在sigmoid两侧，两侧梯度几乎为0，传播几层就没有梯度了。

即使用很好的初始化算法把激活值控制在一个合理范围内，优化几下有几个神经元就又跑到两侧了，而一旦到两侧，因为梯度过小，就再也无法通过梯度更新来使其恢复。

这个问题在提出ReLU和有效的初始化方法（例如MSRA）后已经大概率解决。

后来又出了个Batch Normalization，不管优化多少层都跟浅层一样，梯度消失问题基本可以认为彻底解决了。

链接：https://www.zhihu.com/question/49812013/answer/271392687

猜你喜欢

转载自blog.csdn.net/fu6543210/article/details/82116360

bp算法中梯度消失

深度学习中的梯度消失与梯度爆炸

BP算法的基础——方向导数与梯度

关于BP算法和梯度下降

BP算法（Back Propagation）与梯度下降法

BP网络中反向传播过程梯度下降算法的学习心得

梯度消失

深度学习中的激活函数与梯度消失

神经网络中的梯度消失

深度学习中梯度消失的理解

神经网络中梯度消失、梯度爆炸的问题分析

【机器学习】【RNN中的梯度消失与梯度爆炸】

神经网络训练中的梯度消失与梯度爆炸

梯度消失与梯度爆炸

梯度消失 + 梯度爆炸

梯度消失&&梯度爆炸

梯度爆炸与梯度消失

梯度消失&梯度爆炸

梯度消失，梯度爆炸

梯度消失或梯度爆炸

梯度消失、梯度爆炸

梯度消失梯度爆炸

BPTT算法推导以及LSTM是如何解决梯度消失的

RNN中的梯度消失：隐藏层的梯度&隐藏层系数的梯度

梯度消失和梯度爆炸

梯度爆炸和梯度消失

梯度消失，梯度爆炸及表现

梯度消失与梯度爆炸问题

梯度消失、梯度爆炸笔记

【深度学习】深度学习中RNN梯度消失

今日推荐

AI小程序有哪些？AI小程序哪个好用？微信小程序AI写作叫什么？免费的ai小程序推荐 ai写作小程序推荐

灵办AI工具(科研学术,代码编程,学习辅导,图书报告)功能介绍

Linux内核源码分析（非常详细）零基础入门到精通，收藏这一篇就够了

【C++篇】启航——初识C++（上篇）

数据飞轮崛起：数据中台真的过时了吗？

828华为云征文——使用Flexus云服务器X实例CentOS镜像下创建MySQL服务器教程

阿里巴巴出品的6款AI神器，你用过几个？

【机器学习】多模态AI——融合多种数据源的智能系统

HashiCorp 创始人向 Zig 软件基金会捐赠 30 万美元

1-8 月我国软件业务收入 85492 亿元，同比增长 11.2%

零基础入门鸿蒙开发 HarmonyOS NEXT星河版开发学习

豆包MarsCode帮我2小时完成Go语言系统从开发、测试到部署全流程最佳实践，云IDE迁移PHP企业级项目最佳实践

周排行

Ubuntu+apache2+php5+mysql+phpmyadmin的php环境搭建

基于YOLOv3+Kalman-Filter实现Multi-target tracking

解释C++实例化类的指针类型中的new

苹果手机页面不兼容问题——mui

Python基础语法

javascript学习笔记一【预解释】

python内置函数 map

【Git】使用webstorm操作git

this与super关键字（一）

python list 使用技巧

每日归档

更多

2024-10-04(63)

2024-10-03(2)

2024-10-02(60)

2024-10-01(0)

2024-09-30(0)

2024-09-29(0)

2024-09-28(4)

2024-09-27(60)

2024-09-26(0)

2024-09-25(0)