NLP：自然语言生成中的top-k, top-p, typical采样方法的实现 - 代码天地

NLP：自然语言生成中的top-k, top-p, typical采样方法的实现

企业开发 2023-04-16 14:05:10 阅读次数: 0

在自然语言生成的任务中，如何对训练好的模型进行解码（decode）是一个火热的研究话题。

例如，在自回归式的生成中，模型预测的生成序列 y 的第 t 个值 yt 往往是预测出一个概率分布 p(yt|y<t) ，亦或是条件式的p(yt|x,y<t)。 p 往往是通过模型对词表 V 中的每个词预测一个未经过归一化的激活值 q(yt|y<t) ，然后进行softmax获得，即p(yt|y<t)=eq(yt|y<t)∑v∈Veq(v|y<t))。我们还可以通过加入温度 τ 来让整个分布的熵增加或者减少，即 p(yt|y<t)=eq(yt|y<t)/τ∑v∈Veq(v|y<t))/τ 。在温度比较大时， p 更偏向于均匀分布。

对自回归的生成来说，在确定了如何表示 p 之后，就可以制定解码策略了。最简单的两个策略是（1）greedy decoding，每一步都直接选取概率最高的词；（2）beam search，每一步保留若干个概率最高的序列。对这两种方法不太熟悉的朋友也可以先看这篇很好的简介。近几年的很多工作都提到，这两种策略在自然语言生成中并非最佳，往往会生成很多空序列、无意义序列、重复序列等等 [1, 2, 4, 5]。

上述两种策略都是确定性的解码，固定模型和温度之后，每次得到的序列都是相同的，而另一种方案是使用随机解码，比如采样（sampling），即每一步都直接利用 p 采样生成的词。采样可以增

猜你喜欢

转载自blog.csdn.net/u013250861/article/details/130056491

NLP：自然语言生成中的top-k, top-p, typical采样方法的实现

Top-k & Top-p, Temperature

chatglm常用参数：Top-k, Top-p, Temperature

对话系统之解码策略（Top-k & Top-p & Temperature）

优先级队列解决top-K问题(C语言实现)

Top-K 运算

【数据结构】堆的实现&堆排序&Top-K

Top-K准确率的概念与实现（源码讲解）

[数据结构 -- C语言] 堆实现Top-K问题，原来王者荣耀的排名是这样实现的，又涨知识了

面试题：利用堆排序实现从n个数字中找出前top-k大的数字

MapReduce Top-K问题

堆的top-k问题

自然语言处理（NLP）中多标签分类的方法

Java 数据结构篇-实现堆的核心方法与堆的应用（实现 TOP-K 问题：最小 k 个数）

堆（两种建堆方法）、堆排序和Top-K问题

二叉树堆与堆排序的实现（附有TOP-K问题）

【数据结构】手推堆实现，拳打堆排序，脚踩Top-k

【数据结构】堆的实现，堆排序以及TOP-K问题

【数据结构】堆(Heap):堆的实现、堆排序、TOP-K问题

为什么要用 top_p 做文本生成采样

BFPRT算法（TOP-K问题）

经典问题：Top-K （转载）

堆排序详解+TOP-K问题

Top-K问题详解版

【堆的应用】TOP-K问题

Python解决top-k问题

堆的应用：Top-K问题

面试题 : Top-k问题

数据结构 | TOP-K问题

215. 数组中的第K个最大元素（TOP-K问题）

今日推荐

周排行

四大线程池详解

如何高效使用Vim

Mogodb的常用操作总结

Spyder默认页面布局调整

SAR日志分析

OAuth是一个关于授权（authorization）的开放网络标准，在全世界得到广泛应用，目前的版本是2.0版。本文对OAuth 2.0的设计思路和运行流程，做一个简明通俗的解释，主要参考材料为R

WebService中注解开发，CXF，Spring整合，Rest风格

2019考研英语一 Text1分析

windows下安装docker详细步骤

CentOS 7/6系统升级内核版本到5.2.2

每日归档

更多

2024-08-05(0)

2024-08-04(0)

2024-08-03(0)

2024-08-02(0)

2024-08-01(0)

2024-07-31(0)

2024-07-30(0)

2024-07-29(0)

2024-07-28(0)

2024-07-27(0)