【时空序列预测第十篇】时空序列预测模型之CubicLSTM

其他 2020-06-21 11:14:41 阅读次数: 0

一、Address

AAAI2019的一篇文章

Cubic LSTMs for Video Prediction

论文链接地址: https://arxiv.org/pdf/1904.09412.pdf

二、Introduction and Model

2.1 LSTM以及ConvLSTM

这里简单列举下，其实我已经写过很多次了，只是为了方便大家阅读

LSTM结构具体参考文章：

公式为：

缩写可以表示为：

ConvLSTM论文解读具体参考文章：

缩写可以表示为：

2.2 CubicLSTM

2.2.1 结构

左面是一个立体图，很难看明白其中的结构，咱们主要看右边的b，拓扑图。

整理的cell最主要的特点是将temporal和spatial的信息分开处理，即左图中的sptial axis和temporal axis两个轴方向。

CnbicLSTM包括三个branch：temporal branch， spatial branch， output branch，顾名思义temporal branch主要是获得动作的，也就是目标之间的变化即时间的运动信息，spatial branch主要是获取本身目标的结构信息即目标空间信息，output branch就是把二者做了个整合，之后输出prediction

再仔细看一下结构，感觉不需要多说，这幅图画的很清楚了，大致来讲就是蓝色为spatial,橘黄色为temporal。可以看到空间上，主要是layer的变化，也就是L->L+1，而时间上主要是step的变化，也就是t->t+1

大致说下流程，就是temporal的hidden state和spatial的hidden state以及输入x经过两个conv分别得到时间维度和空间维度的三个门控以及内部状态，之后接下来的各种操作和convLSTM里面基本上一样，最后得到两个hidden state经过conv得到最终的Yt

其实换一个角度本篇的这个结构本质上就是个两个convLSTM的拼接cell，只是生成门控的输入为三个值所决定的。

所以公式也很好得出。

2.2.2 公式

2.2.3 Cubic RNN

这种rnn的提出少不了stacking结构。

我们先看个细节图，玩多了rnn的应该都清楚一般来说temporal的轴线，也就是time step的逐步处理的时候temporal的参数肯定是共享的。

所以下图其实就是一个两层的结构，即红框中的结构

除了这个以外，在spatial上叠加几层，也是为了让objection的信息更加突出，得到更好的空间信息。并且前一步的spatial的信息会传给下一步的最初的层，即蓝色线部分。

这个输入设计的就很有趣了，因为层数主要代表的是spatial，如图这么输入的话也就是说每层考虑了之前的临近的objection的信息，相当于多了一些目标的信息，这个输入称之为slide window。

预测规律如图所示。

这个结构总体来讲就很有趣了，看着像个立体的网

三、Experiments

还是做得Moving MNIST数据集，和predrnn++做的类似，应用了三个数字和两个数字的序列图，以及应用了mse和bce两个评价指标

也做了一些可视化工作。

四、Conclusions

文中其实强调了很多次convlstm的目前无法动摇的地位，之后决定在convlstm上做创新，想到的点子出发点就是如何把temporal和spatial分开
分开之后分别得到c和h，经过前后各一个conv得到门控和c以及最终融合h得到最终的prediction
把结构设计为了一个立体的结构，和平时的平面有一些不同，所以在stacking的时候会感觉像一个立体的网一样的结构

更多精彩内容（请点击图片进行阅读）

公众号：AI蜗牛车

保持谦逊、保持自律、保持进步

个人微信

备注：昵称+学校/公司+方向

如果没有备注不拉群！

拉你进AI蜗牛车交流群

点个在看,么么哒！

猜你喜欢

转载自blog.csdn.net/qq_33431368/article/details/106880118

【时空序列预测第十篇】时空序列预测模型之CubicLSTM

【时空序列预测第十篇】时空序列预测模型之CubicLSTM

【时空序列预测第十篇】Cubic LSTMs for Video Prediction

【时空序列预测第十篇】Cubic LSTMs for Video Prediction

时空序列预测模型的仔仔们

时空序列预测之Convolutional LSTM Network

【时空序列预测实战】风险时空预测？keras之ConvLSTM实战来搞定

【时空序列预测实战】风险时空预测？keras之ConvLSTM实战来搞定

【时空序列】全球气象预测大模型 OpenCastKit 正式开源

综述 | 时空序列预测模型有哪些研究方向？

时空预测 | 线性时空预测模型、图时空预测

最新时空序列预测工作汇总！

【时空序列预测第一篇】什么是时空序列问题？这类问题主要应用了哪些模型？主要应用在哪些领域？

【时空序列预测第一篇】什么是时空序列问题？这类问题主要应用了哪些模型？主要应用在哪些领域？

时空序列预测之PredRNN（用ST-LSTM预测学习的循环神经网络）

【时空序列预测第六篇】EIDETIC 3D LSTM: A MODEL FOR VIDEO PREDICTION AND BEYOND

【时空序列预测第七篇】Satellite Image Prediction Relying on GAN and LSTM Neural Networks

【时空序列预测第七篇】Satellite Image Prediction Relying on GAN and LSTM Neural Networks

【时空序列预测第三篇】PredRNN: Recurrent Neural Networks for Predictive Learning using Spatiotemporal LSTMs

【时空序列预测第三篇】PredRNN: Recurrent Neural Networks for Predictive Learning using Spatiotemporal LSTMs

【时空序列预测第二篇】Convolutional LSTM Network: A Machine Learning Approach for Precipitation Nowcasting

【时空序列预测第二篇】Convolutional LSTM Network: A Machine Learning Approach for Precipitation Nowcasting

【时空序列预测第六篇】EIDETIC 3D LSTM: A MODEL FOR VIDEO PREDICTION AND BEYOND

【时空序列预测第九篇】Deep Learning for Precipitation Nowcasting: A Benchmark and A New Model

【时空序列预测第九篇】Deep Learning for Precipitation Nowcasting: A Benchmark and A New Model

ICDE 2022 | 时空感知交通时间序列预测研究

时空序列预测之EIDETIC 3D LSTM: A MODEL FOR VIDEO PREDICTION AND BEYOND

【时空序列预测第五篇】Memory In Memory: A Predictive Neural Network for Learning Higher-Order Non-Stationarity

【时空序列预测第五篇】Memory In Memory: A Predictive Neural Network for Learning Higher-Order Non-Stationarity

【时空序列预测第四篇】PredRNN++: Towards A Resolution of the Deep-in-Time Dilemma in Spatiotemporal Predictive

今日推荐

周排行

Leetcode简单题61~80

解决zookeeper磁盘IO高的问题

多线程相关方法详解

Maven-setting.xml文件详解

Maven 项目的 classpath 理解

渊亭科技大数据笔试题

配置JVM内存分配

计算机网络个人学习笔记（三）网络层：第三部分连载

js中两个等号(==)和三个等号(===)的区别

用C程序自动打开电脑上的程序

每日归档

更多

2024-09-18(0)

2024-09-17(0)

2024-09-16(0)

2024-09-15(0)

2024-09-14(0)

2024-09-13(0)

2024-09-12(0)

2024-09-11(0)

2024-09-10(0)

2024-09-09(0)