tensorflow:用dynamic_rnn处理不定长序列，对序列做padding处理

其他 2018-07-10 01:12:05 阅读次数: 0

1. 数据处理（padding zero）

首先，我有一个list类型的数据集，按最长将序列的长度存储，不足长度的后面padding zero。将数据集存为ndarray类型的矩阵：

[python]view plain copy
<span><span class="cm-keyword">import</span> <span class="cm-variable">numpy</span> <span class="cm-keyword">as</span> <span class="cm-variable">np</span></span>  

dataset = [[[1], [2], [3], [4]],            # list类型的数据集，有4个序列, feature_dim=1

           [[2], [4], [1]],

           [[5], [2], [7], [3], [8]],

           [[9], [7]]]

feature_dim = 1

num_samples = len(dataset)          # 序列的个数。输出：4

lengths = [len(s) for s in dataset] # 获取每个序列的长度。输出：[4, 3, 5, 2]

max_length = max(lengths)           # 最长序列的长度。输出：5

padding_dataset = np.zeros([num_samples, max_length, feature_dim]) # 生成一个全零array来存放padding后的数据集

for idx, seq in enumerate(dataset): # 将序列放入array中（相当于padding成一样长度）

    padding_dataset[idx, :len(seq), :] = seq

print(padding_dataset) # <type 'numpy.ndarray'>

[[[ 1.]
  [ 2.]
  [ 3.]
  [ 4.]
  [ 0.]]

 [[ 2.]
  [ 4.]
  [ 1.]
  [ 0.]
  [ 0.]]

 [[ 5.]
  [ 2.]
  [ 7.]
  [ 3.]
  [ 8.]]

 [[ 9.]
  [ 7.]
  [ 0.]
  [ 0.]
  [ 0.]]]

如果已知padding的数据，想知道去掉零以后实际这批序列的长度，参考Variable Sequence Lengths in TensorFlow 里的Computing the Sequence Length一节。

2. 用dynamic_rnn运行数据

[python]view plain copy
outputs, last_states = tf.nn.dynamic_rnn(  
    cell=cell,  
    inputs=padding_dataset,  
    sequence_length=lengths)  

猜你喜欢

转载自blog.csdn.net/zzx3163967592/article/details/80810939

tensorflow:用dynamic_rnn处理不定长序列，对序列做padding处理

Keras中RNN不定长输入的处理--padding and masking

TensorFlow笔记：dynamic_rnn

tensorflow之dynamic_rnn

tensorflow 的dynamic_rnn方法

结合CNN与RNN处理序列（Tensorflow）

【转载】【TensorFlow】static_rnn 和dynamic_rnn的区别

【tensorflow】static_rnn与dynamic_rnn的区别

【Reverse】Tensorflow中屏蔽Padding处理变长序列的双向LSTM

tensorflow学习之dynamic_rnn使用详解

TensorFlow TFRecord封装不定长的序列数据（文本）

用dynamic_rnn来进行垃圾邮件分类

[TensorFlow深度学习入门]实战十·用RNN(LSTM)做时间序列预测（曲线拟合）

【手写笔记】tensorflow的static_rnn和dynamic_rnn详解

Tensorflow - 将序列处理成embedding - 方法2 - 手动padding

D:不定长整数序列求和问题

循环神经网络系列（二）Tensorflow中dynamic_rnn

pytorch处理padding变长后的RNN输入

pytorch处理padding变长后的RNN输入

12.10序列处理深度模型 RNN+LSTM

RNN vs LSTM：序列数据处理的选择

【tensorflow2.0】处理时间序列数据

TensorFlow的序列模型代码解释（RNN、LSTM）

用while输入不定长个（本例子以两个为一组）数，并处理

LSTM构建步骤以及static_rnn与dynamic_rnn之间的区别

【转载】 LSTM构建步骤以及static_rnn与dynamic_rnn之间的区别

Tensorflow - 将序列处理成embedding - 方法1 - keras调包

pytorch 对变长序列的处理

java并发序列处理

时间序列数据的处理

今日推荐

周排行

四大线程池详解

如何高效使用Vim

Mogodb的常用操作总结

Spyder默认页面布局调整

SAR日志分析

OAuth是一个关于授权（authorization）的开放网络标准，在全世界得到广泛应用，目前的版本是2.0版。本文对OAuth 2.0的设计思路和运行流程，做一个简明通俗的解释，主要参考材料为R

WebService中注解开发，CXF，Spring整合，Rest风格

2019考研英语一 Text1分析

windows下安装docker详细步骤

CentOS 7/6系统升级内核版本到5.2.2

每日归档

更多

2024-08-05(0)

2024-08-04(0)

2024-08-03(0)

2024-08-02(0)

2024-08-01(0)

2024-07-31(0)

2024-07-30(0)

2024-07-29(0)

2024-07-28(0)

2024-07-27(0)