激活函数选取不当为什会造成梯度消失

其他 2018-07-18 05:10:29 阅读次数: 0

下图为四层神经网络，它包括输入层，输出层，两个隐层

假设输入层到第一个隐层的权值为，偏置值为。两个隐层之间的权值为，偏置值为。第二个隐层到输出层的权值为，偏置值为。现在假设输入的值为，输出为，标签值为。前一层的输出为后一层的输入则输出层输出为：

(f为激活函数)

代价函数我们使用常用的方差函数：

我们知道利用梯度下降法更新权值的公式为：

现在我们想更新的权值，根据权值更新公式则和链式法则有：

假设我们的激活函数为sigmoid函数,他的表达式和导函数为：

扫描二维码关注公众号，回复： 2211958 查看本文章

函数图像，和导函数图像为：

可知他的导函数最大值为0.25<1,我们的例子是四层神经网络，如果是很多层呢，那么多小于1的数连乘，很可能导致梯度消失。

猜你喜欢

转载自blog.csdn.net/qq_29023939/article/details/80260250

激活函数选取不当为什会造成梯度消失

深度学习中的激活函数与梯度消失

深度学习（七）激活函数与梯度消失

梯度消失问题与如何选择激活函数

激活函数ReLU为什么比Sigmoid效果好_梯度消失

个人总结：常见的激活函数梯度下降家族与BatchSize 梯度消失和梯度爆炸

如何选取激活函数

深度学习中的激活函数Sigmoid和ReLu激活函数和梯度消失问题。

关于Deeplearning中的激活函数梯度消失问题以及如何选择激活函数

激活函数及其作用以及梯度消失、爆炸、神经元节点死亡的解释

神经网络激活函数sigmoid relu tanh 为什么sigmoid 容易梯度消失

深度学习 --- 优化入门三（梯度消失和激活函数ReLU）

深度学习之（五）：附1-梯度消失问题与如何选择激活函数

激活函数及其梯度

激活函数与Loss的梯度

【Pytorch】激活函数与loss的梯度

ApacheCN《Sklearn 与 TensorFlow 机器学习实用指南》第11章项目训练深层神经网络（梯度消失与梯度爆炸，选择初始化，选择激活函数）

数值稳定性梯度爆炸梯度消失 + 模型初始化和激活函数动手学深度学习v2 pytorch

项目中缓存是如何使用的？缓存如果使用不当会造成什么后果？

为什么要用缓存？缓存使用不当会造成什么后果

redis专题--如何使用redis，使用不当会造成什么后果？

为什么LSTMs会阻止梯度消失:反向传播的视角

梯度消失

TensorFlow 激活函数、损失函数、梯度下降

梯度消失与梯度爆炸

梯度消失 + 梯度爆炸

梯度消失&&梯度爆炸

梯度爆炸与梯度消失

梯度消失&梯度爆炸

梯度消失，梯度爆炸

今日推荐

周排行

Leetcode简单题61~80

解决zookeeper磁盘IO高的问题

多线程相关方法详解

Maven-setting.xml文件详解

Maven 项目的 classpath 理解

渊亭科技大数据笔试题

配置JVM内存分配

计算机网络个人学习笔记（三）网络层：第三部分连载

js中两个等号(==)和三个等号(===)的区别

用C程序自动打开电脑上的程序

每日归档

2024-09-18(0)

2024-09-17(0)

2024-09-16(0)

2024-09-15(0)

2024-09-14(0)

2024-09-13(0)

2024-09-12(0)

2024-09-11(0)

2024-09-10(0)

2024-09-09(0)