在 Transformer 之前生成文本 Text generation before transformers

企业开发 2023-08-26 20:40:08 阅读次数: 0

1. 在 Transformer 之前生成文本

重要的是要注意，生成算法并不是新的。先前的语言模型使用了一个叫做循环神经网络或RNN的架构。尽管RNN在其时代很强大，但由于需要大量的计算和内存来很好在这里插入图片描述
地执行生成任务，所以它们的能力受到了限制。让我们看一个RNN执行简单的下一个词预测生成任务的例子。

模型只看到了一个之前的词，预测不可能很好。当您扩展RNN实现以能够看到文本中的更多前面的词时，您必须大幅度地扩展模型使用的资源。至于预测，嗯，模型在这里失败了。
在这里插入图片描述

即使您扩展了模型，它仍然没有看到足够的输入来做出好的预测。为了成功预测下一个词，模型需要看到的不仅仅是前几个词。模型需要理解整个句子甚至整个文档。这里的问题是语言是复杂的。

在许多语言中，一个词可以有多个含义。这些是同音词。在这种情况下，只有在句子的上下文中我们才能看到是什么类型的银行。
在这里插入图片描述

句子结构中的词可以是模糊的，或者我们可能称之为句法模糊性。以这句话为例：“老师用书教学生。”老师是用书教学还是学生有书，还是两者都有？如果有时我们自己都不能理解人类语言，算法如何能理解呢？
在这里插入图片描述

好吧，在2017年，Google和多伦多大学发布了这篇论文《Attention is All You Need》后，一切都改变了。变压器架构已经到来。
在这里插入图片描述

这种新颖的方法解锁了我们今天看到的生成AI的进步。它可以有效地扩展到使用多核GPU，它可以并行处理输入数据，使用更大的训练数据集，并且关键是，它能够学会关注它正在处理的词的含义。而Attention is All You Need。这就是标题。
在这里插入图片描述

参考

https://www.coursera.org/learn/generative-ai-with-llms/lecture/vSAdg/text-generation-before-transformers

猜你喜欢

转载自blog.csdn.net/zgpeace/article/details/132379860

在 Transformer 之前生成文本 Text generation before transformers

Text to image论文精读CogView: Mastering Text-to-Image Generation via Transformers(通过Transformer控制文本生成图像)

使用transformers生成文本Generating text with transformers

BioGPT: generative pre-trained transformer for biomedical text generation and mining

LLM：可控文本生成【Controlable Text Generation(CTG)】

《BioGPT: Generative Pre-trained Transformer for Biomedical Text Generation and Mining》 ---- 译文与PPT解释

【Transformer】24、A Survey of Visual Transformers

Transformer 综述 & Transformers in Vision: A Survey

Text to image论文精读 MirrorGAN: Learning Text-to-image Generation by Redescription（通过重新描述学习从文本到图像的生成）

Text Generation based Variational Autoencoders

Text-to-3D Generation

Controllable Text Generation with Language Constraints

Transformer综述大全（1）【A Survey of Visual Transformers】

Transformer综述大全（2）【A Survey of Visual Transformers】

【文本分类】ACT: an Attentive Convolutional Transformer for Efficient Text Classification

Next-ViT: Next Generation Vision Transformer

Natural Language Generation using Transformers and Seq2

ImportError: cannot import name ‘GenerationConfig‘ from ‘transformers.generation.utils‘

[PMLR 2021] Zero-Shot Text-to-Image Generation：零样本文本到图像生成

MultiLabel Text Classification using BERT Transformers

MirroGAN: Learning Text-to-image Generation by Redescription

GlyphControl: Glyph Conditional Control for Visual Text Generation

复现Machine Comprehension by Text-to-Text Neural Question Generation记录

密集预测的视觉Transformer：Vision Transformers for Dense Prediction

综述 | 计算机视觉Transformer 《Transformers in Vision: A Survey》

【深度学习 | Transformer】Transformers 教程：pipeline一键预测

论文阅读：Spatial-Temporal Transformer for Dynamic Scene Graph Generation

论文阅读：CTRL: A CONDITIONAL TRANSFORMER LANGUAGE MODEL FOR CONTROLLABLE GENERATION

论文Spatial-Temporal Transformer for Dynamic Scene Graph Generation

T5: Text-To-Text Transfer Transformer

今日推荐

周排行

四大线程池详解

如何高效使用Vim

Mogodb的常用操作总结

Spyder默认页面布局调整

SAR日志分析

OAuth是一个关于授权（authorization）的开放网络标准，在全世界得到广泛应用，目前的版本是2.0版。本文对OAuth 2.0的设计思路和运行流程，做一个简明通俗的解释，主要参考材料为R

WebService中注解开发，CXF，Spring整合，Rest风格

2019考研英语一 Text1分析

windows下安装docker详细步骤

CentOS 7/6系统升级内核版本到5.2.2

每日归档

更多

2024-08-05(0)

2024-08-04(0)

2024-08-03(0)

2024-08-02(0)

2024-08-01(0)

2024-07-31(0)

2024-07-30(0)

2024-07-29(0)

2024-07-28(0)

2024-07-27(0)