常用激活函数的优缺点 - 代码天地

常用激活函数的优缺点

企业开发 2023-08-26 18:54:20 阅读次数: 0

非线性激活函数是深度学习网络重要的组成部分，随着近几年的快速发展，越来越多的激活函数被提出与改进。选择一个合适的激活函数将决定了模型的最终结果。下文总结了13种常见的激活函数的计算方式与对应图像，文中的计算方式来自于pytorch。

1.Sigmoid

这是一款比较早的激活函数，其计算公式如下所示：

其图示如下：

优点：

Sigmoid函数的输出在(0,1)之间，输出范围有限，优化稳定，可以用作输出层。
连续函数，便于求导。

缺点：

需要幂运算，计算成本高。
输出不是以0为均值的，导致收敛速度下降。
容易出现梯度弥散，在反向传播时，当梯度接近于0，权重基本不会更新，从而无法完成深层网络的训练。

2.LogSigmoid

其计算公式如下所示：

其图示如下：

3.Relu

深度神经网络中最常用的激活函数之一，其计算公式如下所示：

其图示如下：

优点：

在x>0区域上，不会出现梯度饱和、梯度消失的问题，收敛速度快。
不需要进行指数运算，因此运算速度快，复杂度低。

缺点：

输出的均值非0.
存在神经元死亡，在x<0时，梯度为0。这个神经元及之后的神经元梯度永远为0，不再对任何数据有所响应，导致相应参数永远不会被更新。

4.LeakyRelu

上述的Relu对x小于0的情况均输出0，而LeakyRelu在x小于0时可以输出非0值，其计算公式如下所示：

其图示如下：

优点：

解决了Relu的神经元死亡问题问，在负区域具有小的正斜率，因此即使对于负输入值，它也可以进行反向传播。
具有Relu函数的优点。

缺点：

结果不一致，无法为正负输入值提供一致的关系预测

5.Elu

同样是针对ReLU的负数部分进行的改进，ELU激活函数对x小于零的情况采用类似指数计算的方式进行输出，其计算公式如下所示：

其图示如下：

优点：

在所有点上都是连续可微的。
与其他线性非饱和激活函数（如Relu及其变体）相比，有着更快的训练时间。
没有神经元死亡的问题。
作为非饱和激活函数，它不会遇到梯度爆炸或消失的问题，并且拥有更高的准确性。

缺点：

涉及到幂运算，计算速度较慢。

6.PRelu

其中a不是固定的，是通过反向传播学习出来的。其计算公式如下所示：

其图示如下：

7.Relu6

Relu6限制Relu的的输出不超过6，其计算公式如下所示：

其图示如下：

Relu在x>0的区域使用x进行线性激活，有可能造成激活后的值太大，影响模型的稳定性，为抵消ReLU激励函数的线性增长部分，可以使用Relu6函数。

8.RRelu

“随机纠正线性单元”RRelu也是LeakyRelu的一个变体。在RRelu中，负值的斜率在训练中是随机的，在之后的测试中就变成了固定的了。其计算公式如下所示：

其图示如下：

9.SElu

SElu和Elu的形式比较类似，但是多出一个scale参数。其计算公式如下所示：

其图示如下：

pytorch中acale=1.0507009873554804934193349852946。

10.CElu

与上述的SElu类似，CElu同样采用负数区间为指数计算，整数区间为线性计算，其计算公式如下所示：

其图示如下：

11.GElu

在激活函数中加入正则化的方式，其计算公式如下所示：

因为erf无解析表达式，原论文给出了近似解。

其图示如下：

12.Tanh

数学中的双曲正切函数Tanh也是一种神经网络常用的激活函数，尤其是用于图像生成任务的最后一层，其计算公式如下所示：

其图示如下：

优点：

输出均值为0，使其收敛速度要比sigmoid快，可以减少迭代次数。

缺点：

它的缺点是需要幂运算，计算成本高
同样存在梯度消失，因为在两边一样有趋近于0的情况。

13.Tanhshrink

Tanhshrink直接采用输入减去双曲正切值，其计算公式如下所示：

其图示如下：

总结：

首先使用ReLU，速度最快，然后观察模型的表现。

如果ReLU效果不是很好，可以尝试LeakyRelu等变种

在深度不是特别深的CNN中，激活函数的影响一般不会太大。

猜你喜欢

转载自blog.csdn.net/weixin_41202834/article/details/121173761

常用激活函数的优缺点

常用激活函数优缺点及性能对比

常用激活函数及其优缺点的总结与比较

激活函数汇总及各优缺点

深度学习中激活函数的优缺点

深度学习最常用的10个激活函数！（数学原理+优缺点）

激活函数的比较和优缺点，sigmoid，tanh，relu，softmax

非线性激活函数的公式、导数和优缺点

三种激活函数以及它们的优缺点

深度学习中各激活函数的优缺点

常见激活函数优缺点与dead relu problem

为什么使用非线性激活函数？常见的非线性激活函数及优缺点对比

常用框架优缺点

神经网络——损失函数与激活函数的选择及各自优缺点

ReLU激活函数的缺点

常用编程语言的优缺点

深度学习：激活函数的比较和优缺点，sigmoid，tanh，relu

[机器学习] 神经网络-各大主流激活函数-优缺点

神经网络的各种激活函数的优缺点对比分析

构造函数用途及优缺点

宏和函数的优缺点

箭头函数的特点与优缺点

列举四种神经网络激活函数的函数公式、函数图及优缺点和适用场景

宏函数和函数的区别及优缺点

pytorch系列6 -- activation_function 激活函数 relu, leakly_relu, tanh, sigmoid及其优缺点

神经网络激活函数优缺点和比较（sigmod，tanh，relu，softmax，leaky relu，ELU,SELU）

激活函数意义，什么样的函数可以作为激活函数，设计激活函数时需要考虑什么，常见激活函数及其优缺点和应用场景——从感知机到神经网络

常用存储设备优缺点辨析

常用数据库优缺点总汇

JavaScript特点、优缺点及常用框架

今日推荐

周排行

四大线程池详解

如何高效使用Vim

Mogodb的常用操作总结

Spyder默认页面布局调整

SAR日志分析

OAuth是一个关于授权（authorization）的开放网络标准，在全世界得到广泛应用，目前的版本是2.0版。本文对OAuth 2.0的设计思路和运行流程，做一个简明通俗的解释，主要参考材料为R

WebService中注解开发，CXF，Spring整合，Rest风格

2019考研英语一 Text1分析

windows下安装docker详细步骤

CentOS 7/6系统升级内核版本到5.2.2

每日归档

更多

2024-08-05(0)

2024-08-04(0)

2024-08-03(0)

2024-08-02(0)

2024-08-01(0)

2024-07-31(0)

2024-07-30(0)

2024-07-29(0)

2024-07-28(0)

2024-07-27(0)