大模型相关论文100篇短笔记【 2023-04-17】 - 代码天地

大模型相关论文100篇短笔记【 2023-04-17】

企业开发 2023-09-03 10:49:14 阅读次数: 0

自ChatGPT诞生以来，我也读了不少论文了，攒够100篇，分享一下。

有些不算严格意义上的论文，有些也不是严格意义上的大模型论文，反正笔记分类时算进来就当是大模型相关吧。

包括CV和NLP的，主要是大语言模型。

当然也包括不少水论文。

有些笔记可能存在错误等情况，是因为写的时候功力还远不足，理解不到位，也懒得回去改了。

仅供大家选论文参考。

我还是科研小白，和大家一起学习。

1.Language Models are Few-Shot Learners
GPT-3的论文。GPT-2还不够大，所以到了GPT-3就有了海量参数（1750亿）。
由于发现few-shot和one-shot的性能往往比zero-shot高很多（这三者都没有梯度传播，只是提供少量例子或者不提供），所以他们认为语言模型可以看做是元学习者，这导致GPT-3的学习方法也类似于元学习。GPT-3使用的是情景学习（in-context learning），GPT-3论文中说GPT-2也用了类似的方法，不过情景学习这个概念是GPT-3才提出来的。

按照我目前的理解，情景学习就是在预训练外循环中增加一些内部小循环，让它在训练过程中就学习到了一定的任务，这样在使用时

猜你喜欢

转载自blog.csdn.net/u013250861/article/details/132548416

大模型相关论文100篇短笔记【 2023-04-17】

2020 - 04 - 17 个人笔记

[计算机视觉论文速递] 2018-04-17

ICML 2023杰出论文大幅减少至6篇！北大、武理工校友获奖，大模型水印受青睐

【MySQL】索引相关 -- 2019-08-17 04:23:57

【MySQL】索引相关 -- 2019-08-17 04:16:45

2022-04-17 C# 第3篇——核心

2022-04-17 C# 第2篇——基础

【前沿解读】17篇2023淘天业务技术A类顶会论文

KDD2023丨大模型论文合集

【MySQL】数据类型之字符相关 -- 2019-08-17 03:04:43

《Beginning C++17》-学习笔记-Chapter 04-Making Decisions

CVPR 2023上AIGC大爆发！46篇论文、代码和数据集汇总

2020-04-17

2021-04-17

【网安AIGC专题】46篇前沿代码大模型论文、24篇论文阅读笔记汇总

单月120篇！2023年8月diffusion生成扩散模型论文汇总

福布斯发布2023云计算100强榜单，全球流程挖掘领导者Celonis排名17

2020-04-18短笔记：狼又来了

Vocabulary Recitation 2020/04/17

WWW 2023 | 量化交易相关论文（附论文链接）

AAAI 2023 | 量化交易相关论文（附论文链接）

KDD 2023 | 量化交易相关论文（附论文链接）

大模型基础04：OpenAI 大模型开发基础

ICCV 2023 | 腾讯优图16篇论文入选！轻量级主干、异常检测和扩散模型等方向

7月份130篇！2023年7月diffusion生成扩散模型论文汇总

一天自动发现四大数据库100+漏洞，浙大研究获SIGMOD 2023最佳论文

2023-05-17 题目

系统学习大模型的20篇论文

500篇论文！最全代码大模型综述来袭

今日推荐

周排行

四大线程池详解

如何高效使用Vim

Mogodb的常用操作总结

Spyder默认页面布局调整

SAR日志分析

OAuth是一个关于授权（authorization）的开放网络标准，在全世界得到广泛应用，目前的版本是2.0版。本文对OAuth 2.0的设计思路和运行流程，做一个简明通俗的解释，主要参考材料为R

WebService中注解开发，CXF，Spring整合，Rest风格

2019考研英语一 Text1分析

windows下安装docker详细步骤

CentOS 7/6系统升级内核版本到5.2.2

每日归档

更多

2024-08-05(0)

2024-08-04(0)

2024-08-03(0)

2024-08-02(0)

2024-08-01(0)

2024-07-31(0)

2024-07-30(0)

2024-07-29(0)

2024-07-28(0)

2024-07-27(0)