神经网络为什么需要随机初始化模型参数 - 代码天地

神经网络为什么需要随机初始化模型参数

编程语言 2020-02-18 17:04:16 阅读次数: 0

在神经网络中，通常需要随机初始化模型参数。下面解释一下这样做的原因。

设有一个多层感知机模型，假设输出层只保留一个输出单元 $o_1$ ，且隐藏层使用相同的激活函数。如果将每个隐藏单元的参数都初始化为相等的值，那么在正向传播时每个隐藏单元将根据相同的输入计算出相同的值，并传递至输出层。

在反向传播中，每个隐藏单元的参数梯度值相等。因此，这些参数在使用基于梯度的优化算法迭代后值依然相等。之后的迭代也是如此。在这种情况下，无论隐藏单元有多少，隐藏层本质上只有一个隐藏单元在发挥作用。

因此，通常对神经网络的模型参数，特别是权重参数进行随机初始化。随机初始化模型参数的方法有很多，可以使用正态分布的随机初始化方式。

还有一种比较常用的随机初始化方法叫做Xavier随机初始化。假设某全连接层的输入个数为a，输出个数为b，Xavier随机初始化将使该层中权重参数的每个元素都随机采样于均匀分布 $U(-\sqrt{\frac{6}{a+b}},\sqrt{\frac{6}{a+b}})$ 它的设计主要考虑到，模型参数初始化后，每层输出的方差不该受该层输入个数影响，且每层梯度的方差也不该受该层输出个数影响。

发布了250 篇原创文章 · 获赞 9 · 访问量 7857

私信关注

猜你喜欢

转载自blog.csdn.net/qq_37388085/article/details/104377568

神经网络为什么需要随机初始化模型参数

参数初始化对神经网络模型性能的影响

神经网络参数初始化

吴恩达深度学习笔记(21)-神经网络的权重初始化为什么要随机初始化？

为什么神经网络参数不能全部初始化为全0？

视频讲解|为什么神经网络参数不能全部初始化为全0

正则化与参数初始化对神经网络的影响

【深度学习_2.1.1】神经网络参数初始化

神经网络参数初始化方式

神经网络参数的各种初始化算法

神经网络中参数的初始化问题

神经网络参数初始化方法

神经网络 03(参数初始化)

神经网络权重初始化

为什么需要深度神经网络

为什么需要神经网络？

ML（5）——神经网络3（随机初始化与梯度检验）

神经网络权值为什么不能初始化为零（1）

神经网络权重为什么不能初始化为0

深层神经网络参数初始化方式对训练精度的影响

深度学习之:神经网络参数(权重)初始化

神经网络基础知识之参数初始化

人工智能系列实验（四）——多种神经网络参数初始化方法对比（Xavier初始化和He初始化）

DL_C2_week1_1(Initialization)神经网络模型的初始化

神经网络的初始化与正则化

深度学习神经网络中权重的初始化

深度神经网络之初始化

初始化神经网络的权重和偏置

卷积神经网络的权值初始化方法

深度学习——神经网络权重初始化问题

今日推荐

周排行

Access的四舍五入取整

8.23 前端学习过程

入门学习过程方向与漏洞复现总结：

操作分布式文件之八：如何批量并行读写远程文件和事务补偿处理

应邀出个教程（搭建tensorflow跑网络环境）

Kubernetes之Pod控制器应用进阶

14-[mysql内置功能]--

HDU6212 区间dp 好题

VS2015生成代码图

验证手机号的工具类

每日归档

更多

2024-10-21(0)

2024-10-20(0)

2024-10-19(0)

2024-10-18(0)

2024-10-17(0)

2024-10-16(0)

2024-10-15(0)

2024-10-14(0)

2024-10-13(0)

2024-10-12(0)