深度模型（九）：Batch Normalization - 代码天地

深度模型（九）：Batch Normalization

其他 2020-01-25 10:27:01 阅读次数: 0

批量标准化

批量标准化（batch normalaization）概念由2015年的论文《Batch Normalization: Accelerating Deep Network Training by Reducing Internal Covariate Shift》提出，后被广泛的应用于深度学习领域。

下面来看一下批量标准化的计算过程。

比如训练数据mini batch的大小为 $m$ ，某个特征 $x$ 的取值为 $[x_1,x_2,...,x_m]$ ，需要对特征 $x$ 做批量标准化，如何计算呢？

我们将 $x$ 的标准化的输出结果记为 $y=[y_1,y_2,...,y_m],y_i=BN_{\gamma,\beta}(x_i), i\in[1,m]$ ，则计算 $BN_{\gamma,\beta}$ 的过程如下：

$\mu=\frac{1}{m}\sum_{i=1}^mx_i$
$\sigma^2=\frac{1}{m}\sum_{i=1}^m(x_i-u)^2$
$\widehat x_i=\frac{x_i-u}{\sqrt{\sigma^2+\epsilon}}$
$y_i=\gamma x_i + \beta$

其中 $\gamma,\beta$ 为待训练的参数， $\epsilon$ 为超参。

本质思想

批量标准化的思想，来自于这样一个实验观察现象：当网络的输入分布符合标准分布的时候，训练会比较快的收敛。基于这样的现象，有理由可以猜想，如果网络的每一层的输入都符合标准分布，那么训练的过程应该更快。但是如果人为的改变上一层网络输出值的分布，可能会导致信息丢失，降低模型的表达能力，所以在标准化操作之后，引入的两个可学习的参数 $\gamma,\beta$ ，来学习原始分布与标准化分布间的映射关系。这样即加快的模型的训练，有不会降低模型的表达能力。

jony0917

发布了52 篇原创文章 · 获赞 105 · 访问量 7万+

私信关注

猜你喜欢

转载自blog.csdn.net/gaofeipaopaotang/article/details/99869506

深度模型（九）：Batch Normalization

batch normalization 与 layer normalization

Batch Normalization & Layer Normalization

【深度学习】 Batch Normalization

深度学习——Batch Normalization

【深度学习】batch normalization

深度学习-Batch Normalization

【深度学习】：Batch Normalization

Batch Normalization

深度学习中的Batch Normalization

深度学习之Batch Normalization

深度学习-BN(Batch Normalization）

深度学习基础系列（九）| Dropout VS Batch Normalization? 是时候放弃Dropout了深度学习基础系列（七）| Batch Normalization

Batch Normalization导读 Batch Normalization导读

batch_normalization和layer normalization的区别

batch normalization（BN）& group normalization（GN）

Batch normalization和Instance normalization的对比

Batch Normalization与Layer Normalization的区别与联系

Batch Normalization层

解读Batch Normalization

batch normalization 详解

对Batch Normalization的理解

Tensorflow实现Batch Normalization

论文之Batch Normalization

Batch Normalization 学习笔记

[Tensorflow] Batch Normalization实现

Batch Normalization原理

Tensorflow Batch normalization函数

BN算法（Batch Normalization）

Batch Normalization (BN)

今日推荐

周排行

LRU cache算法

windows10, 自带的OpenSSH, key权限问题, 文件权限问题

测试用例书写方法

HIVE-默认分隔符的（linux系统的特殊字符）查看，输入和修改

最贵的AMD 7nm显卡来了！这设计够狂野

java多线程简单demo

[ 转载 ]在Android系统上使用busybox——最简单的方法

QT connect学习

BFSIFT算法分析

Xcode10：library not found for -lstdc++.6.0.9 临时解决

每日归档

更多

2024-08-06(0)

2024-08-05(0)

2024-08-04(0)

2024-08-03(0)

2024-08-02(0)

2024-08-01(0)

2024-07-31(0)

2024-07-30(0)

2024-07-29(0)

2024-07-28(0)