深度/机器学习基础知识要点：RNN、LSTM、GRU - 代码天地

深度/机器学习基础知识要点：RNN、LSTM、GRU

其他 2020-08-10 10:14:55 阅读次数: 0

RNN(循环神经网络)

RNN示意图

$x$ 是一个向量，它表示输入层的值； $s$ 是一个向量，它表示隐藏层的值； $U$ 是输入层到隐藏层的权重矩阵； $o$ 也是一个向量，它表示输出层的值； $V$ 是隐藏层到输出层的权重矩阵。循环神经网络的隐藏层的值 $s$ 不仅仅取决于当前这次的输入 $x$ ，还取决于上一次隐藏层的值 $s$ 。权重矩阵 $W$ 就是隐藏层上一次的值作为这一次的输入的权重。

输出值 ${o}_{t}$ ，是受前面历次输入值 ${x}_{t}、{x}_{t-1}、{x}_{t-2}$ 、…影响的，这就是为什么循环神经网络可以往前看任意多个输入值的原因。
计算公式：
双向循环神经网络
- 示意图
- 计算公式：

LSTM（长短时记忆网络）

单元状态(cell state)

新增加的状态c，称为单元状态(cell state)。我们把上图按照时间维度展开：

在t时刻，LSTM的输入有三个：当前时刻网络的输入值 $x_t$ 、上一时刻LSTM的输出值 $h_{t-1}$ 、以及上一时刻的单元状态 $c_{t-1}$ ；
LSTM的输出有两个：当前时刻LSTM输出值 $h_{t}$ 、和当前时刻的单元状态 $c_{t}$ 。

用到了门（gate）的概念。门实际上就是一层全连接层，它的输入是一个向量，输出是一个0到1之间的实数向量。

LSTM用两个门来控制单元状态c的内容，一个是遗忘门（forget gate），它决定了上一时刻的单元状态 ${c}_{t-1}$ 有多少保留到当前时刻 ${c}_{t}$ ；另一个是输入门（input gate），它决定了当前时刻网络的输入 ${x}_{t}$ 有多少保存到单元状态 ${c}_{t}$ 。LSTM用输出门（output gate）来控制单元状态 ${c}_{t}$ 有多少输出到LSTM的当前输出值 ${h}_{t}$ 。

LSTM需要学习的参数共有8组，分别是：遗忘门的权重矩阵 ${W}_{f}$ 和偏置项 ${b}_{f}$ 、输入门的权重矩阵 ${W}_{i}$ 和偏置项 ${b}_{i}$ 、输出门的权重矩阵 ${W}_{o}$ 和偏置项 ${b}_{o}$ ，以及计算单元状态的权重矩阵 ${W}_{c}$ 和偏置项 ${b}_{c}$ 。

LSTM单元结构：
- 遗忘门：
- 输入门：
- 用于描述当前输入的单元状态，它是根据上一次的输出和本次输入来计算的：
- 当前时刻的单元状态
- 输出门
- LSTM最终的输出

GRU

GRU 是LSTM 的一个变体，GRU 保持了 LSTM 的效果同时又使结构更加简单。

GRU 只剩下两个门，即更新门和重置门。

更新门
用于控制前一时刻的状态信息被代入到当前状态的程度，更新门的值越大说明前一时刻的状态信息带入越多。
重置门
用于控制忽略前一时刻的状态信息的程度，重置门的值越小说明忽略得越多。
GUR单元结构

猜你喜欢

转载自blog.csdn.net/zengNLP/article/details/104135185

深度/机器学习基础知识要点：RNN、LSTM、GRU

【深度学习】RNN | GRU | LSTM

[深度学习]理解RNN, GRU, LSTM 网络

深度学习笔记——RNN（LSTM、GRU、双向RNN）学习总结

深度/机器学习基础知识要点：TFIDF、LDA、LSA

深度/机器学习基础知识要点：CNN、ResNet、DenseNet

深度/机器学习基础知识要点：HMM、MEMM、CRF

深度/机器学习基础知识要点：Matrix Factorization

深度/机器学习基础知识要点：CTC算法

循环神经网络(RNN)及其变体GRU和LSTM的基础知识详解(公式)

深度学习的基础知识(RNN、LSTM等模型、激励函数、正则化、norm batch)

深度学习基本知识介绍、CNN/RNN/LSTM/GRU神经网络原理

深度学习基础：RNN与LSTM

深度学习：循环神经网络（RNN）的变体LSTM、GRU

深度学习----从RNN 到 LSTM 再到进化 GRU

深度学习实战——循环神经网络（RNN、LSTM、GRU）

RNN、LSTM与GRU学习笔记

RNN、LSTM、GRU学习补充

TensorFlow之RNN：堆叠RNN、LSTM、GRU及双向LSTM 深度学习之循环神经网络（RNN）循环神经网络之LSTM和GRU 》

深度/机器学习基础知识要点：SVM、Clustering、LR、GBDT

RNN、LSTM、GRU基础原理篇

深度学习-机器学习基础知识

RNN-LSTM-GRU学习笔记

深度学习--RNN，LSTM

【深度学习】rnn and lstm

RNN-LSTM-GRU

RNN，LSTM和GRU

RNN、GRU、LSTM

RNN - LSTM - GRU

RNN, LSTM, GRU cells

今日推荐

周排行

vue + echart +map中国地图，省市地图，区县地图

spring boot2 (31)-cors跨域请求

『学习资料推荐』299元买的微信营销资料打包

个人学习卷积神经网络的疑惑解答

网络工程师-软考

模拟人生4 春夏秋冬、星梦起飞版更新下载方法以及常见问题

python关于对象的字符串显示str和repr以及

奇怪的session混乱问题

【3】分治法（divide-and-conquer）

Java项目开发成绩管理系统（九）各模块实现信息修改

每日归档

更多

2024-08-07(0)

2024-08-06(0)

2024-08-05(0)

2024-08-04(0)

2024-08-03(0)

2024-08-02(0)

2024-08-01(0)

2024-07-31(0)

2024-07-30(0)

2024-07-29(0)