Rethinking the Role of Demonstrations: What Makes In-Context LearningWork?

背景

这篇论文主要验证了prompt demos对模型的作用是什么,主要几个方面的影响:
1.prompt demo的input和label的映射关系对结果影响非常小,模型没有从mapping关系中学到太多信息。这是比较反直觉的
2.模型从input输入的数据空间和label输出的数据空间中,学习到了大量的信息,对模型预测结果的效果提升起到了关键作用
3.prompt demo序列的总体结构信息,对模型结果影响较大。
4.meta learning会放大prompt demo的作用,模型会学习demo中更加简单的方面。
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

消融实验

1.demos的正确率是否对结果有影响。

demos的正确率对模型效果影响不大。
在这里插入图片描述
在这里插入图片描述

2.demos的数量k是否影响模型效果

1.随着k的增长,模型效果也在增加
2.模型在k>8之后,效果随着k的增长,效果不明显,说明8个左右的demo,已经提供了足够的信息。
在这里插入图片描述
在这里插入图片描述

3.demo的质量是否影响模型效果

1.可以看到影响不大

在这里插入图片描述
在这里插入图片描述

为什么in-context learning起作用?

1.prompt demo的input和label的映射关系对结果影响非常小,模型没有从mapping关系中学到太多信息。这是比较反直觉的
2.模型从input输入的数据空间和label输出的数据空间中,学习到了大量的信息,对模型预测结果的效果提升起到了关键作用
3.prompt demo序列的总体结构信息,对模型结果影响较大。
4.meta learning会放大prompt demo的作用,模型会学习demo中更加简单的方面。

在这里插入图片描述

继续讨论

在这里插入图片描述

6.1模型是否从demo中学习到了知识。

1.如果严格的定义学习从input-label关系中的话,其实是没有学习到的。
2.如果从模型去适应demo的input-label数据空间和demo的格式的话,其实是学习到了相应的知识。
在这里插入图片描述
在这里插入图片描述

6.2模型的能力

1.模型其实已经从他自身的目标中学习到了input-label的映射关系。

6.3 zero-shot的效果提升

1.可能可以通过非监督学习提升效果。

在这里插入图片描述

猜你喜欢

转载自blog.csdn.net/WitsMakeMen/article/details/132608809