LSTM变种-GRU网络结构

其他 2020-01-16 11:50:58 阅读次数: 0

简介

GRU是LSTM的一种变体，其将忘记门和输入门合成了一个单一的更新门。同样还混合了细胞状态和隐藏状态，加诸其他一些改动。最终的模型比标准的 LSTM 模型要简单，是非常流行的变体。
使用LSTM的原因之一是解决RNN Deep Network的Gradient错误累积太多，以至于Gradient归零或者成为无穷大，所以无法继续进行优化的问题。GRU的构造更简单：比LSTM少一个gate，这样就少几个矩阵乘法。在训练数据很大的情况下GRU能节省很多时间。

GRU模型

与LSTM不同，GRU只有两个门了，分别为更新门和重置门，即图中的 $z_t$ 和 $r_t$ 。更新门用于控制前一时刻的状态信息被带入到当前状态中的程度，更新门的值越大说明前一时刻的状态信息带入越多。重置门用于控制忽略前一时刻的状态信息的程度，重置门的值越小说明忽略得越多。
这里写图片描述

GRU训练

从前面的公式中可以看到需要学习的参数就是 $W_rW_zW_hW_o$ 那些权重参数，其中前三个权重都是拼接的，所以在学习时需要分割出来，即
这里写图片描述
输出层的输入 $y^i_t=W_oh，输出为y^o_t=σ(y^i_t)$ 。
设某时刻的损失函数为 $Et=1/2*(y_d−y^o_t)^2$ ，则某样本的损失为

与前面LSTM网络类似，最终可以推出

GRU与LSTM

这里写图片描述

参考资料：
https://blog.csdn.net/wangyangzhizhou/article/details/77332582
https://blog.csdn.net/lreaderl/article/details/78022724

一夜了

发布了98 篇原创文章 · 获赞 337 · 访问量 48万+

他的留言板关注

猜你喜欢

转载自blog.csdn.net/yiyele/article/details/80672554

LSTM变种-GRU网络结构

几种常见的循环神经网络结构RNN、LSTM、GRU

RNN的优秀变种: LSTM & GRU

Understanding LSTM Networks（LSTM的网络结构）

GRU和LSTM结构对比

9 神经序列模型之 RNN 及其变种 LSTM、GRU

LSTM与GRU神经网络

通俗易懂LSTM｜RNN的变种结构 | LSTM长短期记忆网络

LSTM和GRU结构及原理介绍

RNN、GRU和LSTM的结构与公式讲解

[深度学习]理解RNN, GRU, LSTM 网络

LSTM和GRU网络的高级运用实例

LSTM和GRU网络的介绍和区别

循环神经网络-GRU和LSTM

4.4 高级神经网络结构-什么是 LSTM 循环神经网络

GRU与LSTM

LSTM与GRU

LSTM & GRU

GRU and LSTM

LSTM 与 GRU

Pytorch神经网络实战学习笔记_23 循环神经网络结构：LSTM结构+双向RNN结构

自然语言处理 - 梯度消失和RNN变种 (LSTM, GRU, 双向RNN, 多层RNN)

机房网络结构

网络结构

refinedet网络结构

LoRa网络结构

VOTE网络结构

VGG网络结构

osi网络结构

光网络结构

今日推荐

周排行

深度学习------Lingvo框架下的加速通道GPipe

webjars管理静态资源

C专家编程_2.2

mysql 源码安装

json文件操作

123231432

注解的实现

Spring MVC 控制器

《人月神话》读后感二

C#使用HttpWebRequest和HttpWebResponse上传文件示例

每日归档

更多

2024-09-08(0)

2024-09-07(0)

2024-09-06(0)

2024-09-05(0)

2024-09-04(0)

2024-09-03(0)

2024-09-02(0)

2024-09-01(0)

2024-08-31(0)

2024-08-30(0)