[论文阅读笔记76]GPT Understands, Too(P-tuning) - 代码天地

[论文阅读笔记76]GPT Understands, Too(P-tuning)

业界资讯 2023-07-30 00:17:33 阅读次数: 0

1. 基本信息

题目	论文作者与单位	来源	年份
GPT Understands, Too	清华大学

Citations, References

论文链接：https://arxiv.org/pdf/2103.10385.pdf

论文代码：

2. 要点

研究主题	问题背景	核心方法流程	亮点	数据集	结论	论文类型	关键字
微调大模型	采用传统微调的gpt在自然语言理解（NLU）方面未能取得良好的效果，所以提出了P-tuning.			LAMA，SuperGlue	P-tuning在少样本上，在bert，gpt都取得不错的效果。

3. 模型(核心内容)

3.1 模型例子

这里的模型思想是例如有一个模板T：The capital of [X] is [Y], 这里的X定义为上下文，Y定义为目标，其它字符表示prompt.

对于离散型，每一个prompt提示词都可以在V词典中查到，然后都可以经过预模型模型进行编码。

*** T = {*****[P_0:i ], x, *****[P_*****i+1:m], y}, [P_i ] *****∈ V, ***

在p-tuning中p_i被看成是一个伪token,对应用的模板应该是这样的：

这里的h_i是可以训练的的，通过训练可以获得列准确的prompt，这个prompt将会超过当前的prompt.

最后的损失函数为：

其它这个跟之前几篇思想是一样的。直接把离散的代替成了连续的。

优化时面临两个挑战：

Discreteness

如果h用随机分布初始化，优化器很容易落入局部极小值。

Association

嵌入的h应该是相互联系的，并不是独立的，在设计时应该把h的相关作用加入去。

解决这个方法：把h隐变量建立成一个序列，采用一prompt编码器来进行编码，这个编码器采用小而轻的神经网络的完成。实际的实践中采用了lstm来完成。

4. 实验与分析

4.1 实验

任务1：LAMA (Petroni et al., 2019) knowledge probing

把三元组 (Dante, born-in, Florence) 变成cloze的句子：“Dante was born in [MASK].”,作为原始的样本。

1) Manual Prompt（MP）：使用LAMA的原始手工提示；

2）Fine-tuning（FT）：通过主语与微调模型去预测宾语；

3) Manual Prompt with Fine-tuning（MP+FT）：使用手工提示数据来微调语言模型；

4)P-tuning：使用连接提示（固定语言模型的参数）。

另外发现，LAMA-29k数据集中P-tuning比fine tuning还要好。

任务2：SuperGlue (Wang et al., 2019b)

BERT-base-case,GPT2-base,BERT-large-cased, GPT2-medium, 从这些实验结果来看，基本上是超过Fine-tuning的效果的。

few shot中的提示的语义、格式、语法没有明显的相关性，其次，手动提示中的微小变化会导致巨大的性能差异。

5. 总结

思想与之前的两篇的差不多，这篇也做了很多实验，效果大部分可与fine tuning进行比较了。挺好的。

7. 知识整理（知识点，要读的文献，摘取原文）

8. 参考文献

made by happyprince

猜你喜欢

转载自blog.csdn.net/ld326/article/details/131178956

[论文阅读笔记76]GPT Understands, Too(P-tuning)

GPT Understands，Too

P-tuning论文概述

[论文阅读笔记75]P-Tuning v2

P-Tuning v2论文概述

HuggingFace学习笔记--Prompt-Tuning、P-Tuning和Prefix-Tuning高效微调

论文解读：P-Tuning v2: Prompt Tuning Can BeComparable to Fine-tuning Universally Across Scales and Tasks

论文笔记 P-Tuning v2 与微调性能相等的提示性优化

GPT实战系列-P-Tuning本地化训练ChatGLM2等LLM模型，到底做了什么？(二)

GPT实战系列-P-Tuning本地化训练ChatGLM2等LLM模型，到底做了什么？(一)

PET =＞ P-tuning =＞PPT

大模型高效微调综述上：Adapter Tuning、AdaMix、PET、Prefix-Tuning、Prompt Tuning、P-tuning、P-tuning v2

大模型微调方法总结：LoRA、Adapter、Prefix-tuning、P-tuning、Prompt-tuning

ChatGLM-6B 部署与 P-Tuning 微调实战

大语言模型LLM微调技术：P-Tuning

Fine-tuning: 深度解析P-tuning v2在大模型上的应用

大模型微调（finetune）方法总结-LoRA,Adapter,Prefix-tuning，P-tuning，Prompt-tuning

（三）ChatGLM-6B 的 DeepSpeed/P-Tuning v2微调

ChatGLM-6B的P-Tuning微调详细步骤及结果验证

P-Tuning v2: 与微调性能相等的提示性优化

基于 P-Tuning的高效微调ChatGLM2-6B

阅读笔记——《Removing RLHF Protections in GPT-4 via Fine-Tuning》

GPT-4：论文阅读笔记

手把手带你实现ChatGLM2-6B的P-Tuning微调

基于 P-Tuning v2 进行 ChatGLM2-6B 微调实践 | 京东云技术团队

大模型-DeltaTuning-增量式03：Prompt-Tuning（P-tuning v1）【只在输入层加入可训练参数层】

通俗理解大模型的各大微调方法：从Prefix Tuning、P-Tuning V1/V2到LoRA、QLoRA

论文阅读9-Fine-tuning Pre-Trained Transformer Language Models to(远程监督关系抽取,ACL2019,GPT,长尾关系,DISTRE）

[论文阅读笔记74]The Power of Scale for Parameter-Efficient Prompt Tuning

人工智能大语言模型微调技术：SFT 监督微调、LoRA 微调方法、P-tuning v2 微调方法、Freeze 监督微调方法

今日推荐

周排行

LRU cache算法

windows10, 自带的OpenSSH, key权限问题, 文件权限问题

测试用例书写方法

HIVE-默认分隔符的（linux系统的特殊字符）查看，输入和修改

最贵的AMD 7nm显卡来了！这设计够狂野

java多线程简单demo

[ 转载 ]在Android系统上使用busybox——最简单的方法

QT connect学习

BFSIFT算法分析

Xcode10：library not found for -lstdc++.6.0.9 临时解决

每日归档

更多

2024-08-06(0)

2024-08-05(0)

2024-08-04(0)

2024-08-03(0)

2024-08-02(0)

2024-08-01(0)

2024-07-31(0)

2024-07-30(0)

2024-07-29(0)

2024-07-28(0)