深度学习 - 激活函数

其他 2018-06-29 20:15:43 阅读次数: 2

激活函数（Activation functions）

sigmoid

公式:

a = σ (z) = \frac{1}{1 + e^{- z}}

$a = \sigma(z) = \frac{1}{1+e^{-z}}$

sigmoid

求导:

$a^{^{'}} = a * (1 - a) = \frac{1}{1 + e^{- z}} * (1 - \frac{1}{1 + e^{- z}})$ $a^{'} = a * (1 - a) = \frac{1}{1+e^{-z}} * (1 - \frac{1}{1+e^{-z}})$
优点:
- 常用于二分类的输出层, 其他地方基本不使用
- 是softmax的一种特殊形式
- 结果介于[0, 1]
缺点：
- 在z特别大或者特别小的时候，导数的梯度或者说函数的斜率会接近于0，从而使得梯度下降很慢，造成梯度消失

tanh

公式:

a = t a n h (z) = \frac{e^{z} - e^{- z}}{e^{z} + e^{- z}}

$a = tanh(z) = \frac{e^{z} - e^{-z}}{e^{z} + e^{-z}}$

tanh

求导:
$a^{^{'}} = 1 - (t a n h (z))^{2}$ $a^{'} = 1 - (tanh(z))^2$
优点:
- tanh函数是sigmoid的向下平移和伸缩后的结果
- 在隐藏层的效果优于sigmoid
- 结果介于[-1, 1]
缺点：
- 在z特别大或者特别小的时候，导数的梯度或者说函数的斜率会接近于0，从而使得梯度下降很慢，也会造成梯度消失

ReLu

公式:

a = m a x (0, z)

$a = max(0, z)$

relu

求导:
$a^{^{'}} = {\begin{cases} 0 & z < 0 \\ 1 & z > 0 \\ 0 或者 1 & z = 0 \end{cases}$ $a^{'} = \begin{cases} 0& \text{z < 0}\\ 1& \text{z > 0}\\ 0或者1& \text{z = 0}\\ \end{cases}$
优点:
- 函数计算简单，方便求导, 与其他激活函数相比，速度更快
- 如果不确定是用什么激活函数，那么默认使用ReLu
缺点
- 梯度等于0时，神经元此时不会训练，产生所谓的稀疏性，改进版Leaky Relu没有这个问题

Leaky Relu

公式:

a = m a x (a l p h a * z, z)

$a = max(alpha * z, z)$

lrelu

求导:

a^{^{'}} = {\begin{cases} a l p h a & z < 0 \\ 1 & z > 0 \\ 0 或 者 1 & z = 0 \end{cases}

$a^{'} = \begin{cases} alpha& \text{z < 0}\\ 1& \text{z > 0}\\ 0或者1& \text{z = 0}\\ \end{cases}$

优点:
- alpha取值一般为0.1或者0.01
- ReLu的改进版, 当z较小时, 避免梯度为0造成神经元”死亡”
- 效果比ReLu要好, 但是实际中使用的并不多

猜你喜欢

转载自blog.csdn.net/u012678352/article/details/80748186

[深度学习] 激活函数

深度学习 - 激活函数

深度学习----激活函数

【深度学习】激活函数

深度学习：激活函数

深度学习-激活函数

深度学习中的激活函数

深度学习常用激活函数

深度学习：激活函数总结

深度学习-激活函数总结

深度学习的激活函数学习

深度学习基础--loss与激活函数--好的激活函数的性质

深度学习—常见激活函数对比

深度学习中的激活函数与梯度消失

深度学习——激活函数Sigmoid/Tanh/ReLU

深度学习（七）激活函数与梯度消失

深度学习之激活函数分析

深度学习常见激活函数

深度学习中激活函数的优缺点

深度学习之激活函数（三）

[深度学习]神经网络的激活函数

深度学习--激活函数的对比分析

深度学习几种主流激活函数总结

深度学习基础--loss与激活函数--

深度学习笔记2-激活函数

深度学习中的激活函数导引

深度学习的四种激活函数

深度学习中的激活函数介绍

深度学习笔记--激活函数：sigmoid，maxout

深度学习中常见的激活函数

今日推荐

周排行

四大线程池详解

如何高效使用Vim

Mogodb的常用操作总结

Spyder默认页面布局调整

SAR日志分析

OAuth是一个关于授权（authorization）的开放网络标准，在全世界得到广泛应用，目前的版本是2.0版。本文对OAuth 2.0的设计思路和运行流程，做一个简明通俗的解释，主要参考材料为R

WebService中注解开发，CXF，Spring整合，Rest风格

2019考研英语一 Text1分析

windows下安装docker详细步骤

CentOS 7/6系统升级内核版本到5.2.2

每日归档

更多

2024-08-05(0)

2024-08-04(0)

2024-08-03(0)

2024-08-02(0)

2024-08-01(0)

2024-07-31(0)

2024-07-30(0)

2024-07-29(0)

2024-07-28(0)

2024-07-27(0)