Top_k

top-k是指只保留概率最高的前k个单词，然后基于剩余单词的概率进行归一化，从中随机抽取一个单词作为最终输出。这种方法可以限制输出序列的长度，并仍然保持样本的一定多样性。

举个例子，在使用语言模型生成「这个周末天气很」的句子时，top-k保留概率最高的三个单词为「好」「热」「冷」，此时将剩余单词进行概率归一化，把它们的概率设定为0，之后在三个保留的单词中随机选择一个，比如选择了「好」后，这个句子就变成了「这个周末天气很好」。这个过程可以反复进行，直到生成的句子已经满足需要。

通过使用top-k，我们可以限制输出序列的长度，并尽可能地保持语句的一定多样性，同时控制结果的生成质量。需要注意的是，取值过小会导致结果过于随机，而过大可能会限制生成的单词种类和多样性，这个超参的设定需要根据任务需求和经验进行调整。

Top_p

top-p是一种用于在文本生成中控制输出的策略。top-p算法保留累计概率之和达到一个给定阈值p的概率分布中的词汇，然后在这个分布中进行随机采样，从而生成一个单词。

举一个例子，假设我们选择的p值为0.8，然后通过语言模型预测下一个单词。假设根据模型，我们得到了10个可选单词，它们分别具有不同的概率分布。下面是假设的10个单词和它们的概率：

单词1: 0.25
单词2: 0.20
单词3: 0.15
单词4: 0.1
单词5: 0.07
单词6: 0.06
单词7: 0.05
单词8: 0.04
单词9: 0.03
单词10: 0.01

根据top-p算法，我们会按照概率从大到小的顺序，逐个累加单词的概率，直到累计概率达到0.8。上面10个单词累计概率为：

单词1: 0.25
单词1+单词2: 0.45
单词1+单词2+单词3: 0.60
单词1+单词2+单词3+单词4: 0.70
单词1+单词2+单词3+单词4+单词5: 0.77
单词1+单词2+单词3+单词4+单词5+单词6: 0.83

累加到单词6时，累计概率已经达到了0.83，因此我们会从这6个单词中进行随机抽样，以选择最终的输出。

top-p算法可以控制输出单词的多样性，因为它可以保留给定阈值下的累计概率的单词。如果阈值设置的比较小，如0.3，则选择的单词就更少，结果可能不够多样化；如果阈值设置的比较大，如0.9，则选择的单词就更多，结果可能会过于随机。因此，选择一个合适的阈值需要结合任务需求和实际情况进行测试和调整。

联合共用

假设我们要生成一个关于水果的简短文本，我们的模型输出了以下10个单词和它们的概率分别是：

苹果：0.2
橙子：0.2
香蕉：0.1
葡萄：0.1
草莓：0.1
芒果：0.1
桃子：0.05
菠萝：0.05
柚子：0.04
火龙果：0.03

我们想要生成多样性的语句，那么可以在top-k和top-p的约束下进行采样，下面来具体说明。

首先，我们可以设置top-k为5，表示保留概率最高的5个单词。这样就会保留苹果、橙子、香蕉、葡萄和草莓这5个单词，并去掉其他单词，也就是

苹果：0.2
橙子：0.2
香蕉：0.1
葡萄：0.1
草莓：0.1

接下来，我们可以使用top-p的方法，保留概率的累计和达到0.4的单词，也就是选取橙子、苹果、草莓三种水果。我们对这三种水果重新进行归一化，概率分别为：

苹果：0.4
橙子：0.4
草莓：0.2

接着，我们可以从上述分布中进行随机采样，选取一个单词作为最终的生成结果。最终生成的水果可能是苹果或橙子或草莓，并且橙子和苹果的概率要比草莓的概率高一些，因为它们的概率更大。

从这个例子可以看出，top-k和top-p可以结合使用，确保我们生成的语句既具有多样性，又具有合理性，同时可以吸引读者的注意力。在不同的任务和需求中，我们可以根据实际情况来调节参数，从而得到更好的输出结果。

Huggingface的GenerationConfig 中的top_k与top_p详细解读

Huggingface的GenerationConfig 中的top_k与top_p详细解读

Top_k

Top_p

联合共用

猜你喜欢