当卷积层后跟batch normalization层时为什么不要偏置b - 代码天地

当卷积层后跟batch normalization层时为什么不要偏置b

编程语言 2019-05-09 19:06:03 阅读次数: 0

起因

之前使用的是inception-v2模型，在v2中，标准的卷积模块为：
* conv_w_b->bn->relu ->pooling*
即，在v2中，尽管在卷积之后、激活函数之前大量使用batch normalization，但是卷积层依然使用可学习的偏置参数。

这也比较符合我的直观理解，因为偏置在一般的卷积神经网络中本来就是很重要的，可以让超判决面不过原点。
但是我在读inception-v3的代码时，发现v3中一个卷积模块中 bn和bias是不共存的，这令我很费解，这么重要的参数为什么没有？
解

后来想明白了，接下来是明白的过程：

首先，看bias的有无到底会不会对bn的结果造成影响？
bn操作的关键一步可以简写为：

好了。
那么为什么没有bias的卷积层能够对bn后的输入学习到很好的决策面呢？
当然啦，bn本身就是将数据归一化到标准分布的呀~
---------------------
作者：夕何
来源：CSDN
原文：https://blog.csdn.net/u010698086/article/details/78046671
版权声明：本文为博主原创文章，转载请附上博文链接！

猜你喜欢

转载自blog.csdn.net/zxyhhjs2017/article/details/90035238

当卷积层后跟batch normalization层时为什么不要偏置b

为什么会出现Batch Normalization层

有batch normalization的卷积层的前向和后向传播

Batch Normalization层

Caffe Batch Normalization层解析

Batch Normalization层的原理与作用

Caffe下卷积神经网络（CNN）中的一些特殊层(Batch Normalization)

神奇的Batch Normalization 仅训练BN层会发生什么

InceptionV2----Batch Normalization层

【深度学习】——BN层（batch normalization）

阅读笔记2——BN层（Batch Normalization）

卷积层

为什么要将全连接层转化为卷积层

batch-normalization为什么效果好

为什么BN？batch normalization的原理及特点

CNN——Batch Normalization（BN）BN层的学习笔记~

批量归一化：Batch Normalization层原理+Pytorch实现

神经网络BN(Batch Normalization)层总结(下)

神经网络BN(Batch Normalization)层总结(上)

卷积层，pooling层的理解

卷积层与池化层

tensorflow 卷积层

TensorFlow的卷积层

CNN术语：卷积层

Pytorch之卷积层

卷积层运算实例

卷积层 convolutional networks

卷积层的dropout - dropblock

keras卷积层参数

keras-卷积层

今日推荐

周排行

成为C++高手之宏与枚举

在CAD二次开发中使用进度条

Js插件ECharts，HighCharts学习网址整理

Celery提交任务出错(on windows.)

cephfs内核客户端性能追踪

thinkphp中PHPExcel用法

EntityFramework动态组合多排序字段

汇编语言（八）实验9 根据材料编程

安装ubuntu后必须做的事情（对我而言）

JS函数式编程

每日归档

更多

2024-10-22(0)

2024-10-21(0)

2024-10-20(0)

2024-10-19(0)

2024-10-18(0)

2024-10-17(0)

2024-10-16(0)

2024-10-15(0)

2024-10-14(0)

2024-10-13(0)