relu不可微为什么可用于深度学习 - 代码天地

relu不可微为什么可用于深度学习

其他 2018-09-22 03:11:41 阅读次数: 0

首先确定relu数学上来讲不可微的，提供伪梯度使其可分，faux gradient是伪梯度，使得在0值不可分；

这里讲到了本质，反馈神经网络正常工作需要的条件就是每一个点提供一个方向，即导数；0值不可微，本质上来说是因为这个地方可画多条切线，但我们需要的只是一条；由于这出现的0值的概率极低，任意选择一个子梯度就OK了，在0处的次微分集合是【0，1】；即选择其中一个就OK了；一般默认是0；

猜你喜欢

转载自blog.csdn.net/ningyanggege/article/details/82493023

relu不可微为什么可用于深度学习

深度学习（十六） ReLU为什么比Sigmoid效果好

为什么使用relu

深度学习——人工神经网络中为什么ReLu要好过于tanh和sigmoid function？

sigmoid relu激活函数, 为什么使用relu?

深度:为什么区块链不可或缺?

ReLU为什么比Sigmoid效果好

深度学习面试题05：激活函数sigmod、tanh、ReLU、leaky Relu、Relu6

深度学习——激活函数Sigmoid/Tanh/ReLU

深度学习基础十二 ReLU vs PReLU

3、深度学习为什么火起来？

深度学习中为什么使用卷积？

深度学习--为什么要深？

深度学习笔记之为什么是SoftMax

为什么是神经网络&深度学习

大模型为什么是深度学习的未来？

为什么给手机链接的wifi设置了代理之后不可用

【深度学习】为什么深度学习需要大内存？

不可变对象为什么不可变

为什么Relu会导致死亡节点

激活函数ReLU为什么比Sigmoid效果好_梯度消失

ReLU为什么比Sigmoid效果好，有何不同？

String为什么不可变

String为什么不可改变？

String为什么不可变？

String为什么是不可变的?

String 为什么是不可变的

String为什么是不可变的

String 为什么不可变 ?

为什么String 是不可变的？

今日推荐

周排行

成为C++高手之宏与枚举

在CAD二次开发中使用进度条

Js插件ECharts，HighCharts学习网址整理

Celery提交任务出错(on windows.)

cephfs内核客户端性能追踪

thinkphp中PHPExcel用法

EntityFramework动态组合多排序字段

汇编语言（八）实验9 根据材料编程

安装ubuntu后必须做的事情（对我而言）

JS函数式编程

每日归档

更多

2024-10-22(0)

2024-10-21(0)

2024-10-20(0)

2024-10-19(0)

2024-10-18(0)

2024-10-17(0)

2024-10-16(0)

2024-10-15(0)

2024-10-14(0)

2024-10-13(0)