任何的书写错误、排版错误、概念错误等,希望大家包含指正。
PixelRNN
论文信息
作者:Aaron van den Oord(Google DeepMind)
期刊:PMLR(JMLR)
发布时间与更新时间:2016.01.25 2016.02.29 2016.08.19
主题:计算机视觉、生成模型、自回归模型、LSTM、CNN
概述
在自然语言处理中,自回归的思想在生成类任务中的应用非常广泛,自回归模型通过联合概率分解为条件概率的乘积进行建模。渐渐地,自回归思想也被应用于图像生成任务中。
作者提出了四种自回归模型,三种基于 RNNs 的自回归模型(Diagonal BiLSTM、Row LSTM 和 Multi-Scale PixelRNN)和一种基于 CNNs 的模型(PixelCNN)。在模型训练阶段,RNNs 模型采用并行和串行两种计算方式,CNNs 模型采用全并行方式;在图像生成阶段,RNNs 模型和 CNNs 模型均采用串行计算方式,即根据已生成的像素信息生成之后的像素。
模型概述
图 1 模型框架