LLaMA的解读与其微调：Alpaca-LoRA/Vicuna/BELLE/中文LLaMA/姜子牙/LLaMA 2

企业开发 2023-07-28 19:13:24 阅读次数: 0

前言

近期，除了研究ChatGPT背后的各种技术细节不断看论文(至少100篇，100篇目录见此：ChatGPT相关技术必读论文100篇)，还开始研究一系列开源模型(包括各自对应的模型架构、训练方法、训练数据、本地私有化部署、硬件配置要求、微调等细节)

本文一开始是作为此文《ChatGPT技术原理解析：从RL之PPO算法、RLHF到GPT4、instructGPT》的第4部分，但随着研究深入为避免该文篇幅又过长，将把『第4部分开源项目』抽取出来独立成本文，然后不断续写本文直至成了一个系列

毕竟我上半年的目标之一，便是把ChatGPT涉及的所有一切关键技术细节，以及相关的开源项目都研究的透透的，故过程中会不断产出一篇篇新文章、新课程(比如七月类ChatGPT微调实战课)出来

第一部分 LLaMA的代码级解读：RMSNorm/SwiGLU/RoPE/Transformer

1.1 Meta发布LLaMA((7B 13B 33B 65B)&#x

猜你喜欢

转载自blog.csdn.net/u013250861/article/details/131971188

LLaMA的解读与其微调：Alpaca-LoRA/Vicuna/BELLE/中文LLaMA/姜子牙/LLaMA 2

类ChatGPT模型LLaMA的解读与其微调：Alpaca-LoRA/Vicuna/BELLE

使用 DPO 微调 Llama 2

[NLP]使用Alpaca-Lora基于llama模型进行微调教程

Llama-1｜Alpaca-LoRA 微调模型下载以及安装推理教程

使用DPO微调Llama2

微调语言大模型选LoRA还是全参数？基于LLaMA 2深度分析

【LLM模型篇】LLaMA2 | Vicuna | EcomGPT等

NLP之LLMs：《Zeno Chatbot Report》的翻译与解读—CMU副教授详测七款个类ChatGPT大模型(GPT-2、LLaMa、Alpaca、Vicuna、MPT-Chat、Coher

[NLP]LLaMA与LLamMA2解读

LLaMA模型微调版本 Vicuna 和 Stable Vicuna 解读

【类ChatGPT】中文LLaMA-2、Alpaca-2 二代羊驼大模型体验

大语言模型之十五-预训练和监督微调中文LLama-2

LLM系列 | 20 : Llama2 实战(下篇)-中文语料微调(附完整代码)

快速玩转 Llama2！阿里云机器学习 PAI 推出最佳实践（一）——低代码 Lora 微调及部署

Llama2~baby

LLaMa2

LLM - Transformer && LLaMA2 结构分析与 LoRA 详解

训练自己的Llama 2！大模型微调技术介绍

使用QLoRA对Llama 2进行微调的详细笔记

全面对比GPT-3.5与LLaMA 2微调

LLMs：LLaMA Efficient Tuning(一款可高效微调【全参数/LoRA/QLoRA】主流大模型【ChatGLM2/LLaMA2/Baichuan等】的高效工具【预训练+指令监督微调+

类ChatGPT项目的部署与微调(上)：从LLaMA到Alpaca、BELLE

Firefly-LLaMA2-Chinese - 开源中文LLaMA2大模型

足够惊艳，使用Alpaca-Lora基于LLaMA(7B)二十分钟完成微调，效果比肩斯坦福羊驼

国内最大Llama开源社区发布首个预训练中文版Llama2

最强开源大模型？Llama 2论文解读

alpaca-lora微调

LLaMA-v2-Chat 与 Alpaca：什么时候应该使用每种 AI 模型？

Llama 2 团队里的华人

今日推荐

周排行

四大线程池详解

如何高效使用Vim

Mogodb的常用操作总结

Spyder默认页面布局调整

SAR日志分析

OAuth是一个关于授权（authorization）的开放网络标准，在全世界得到广泛应用，目前的版本是2.0版。本文对OAuth 2.0的设计思路和运行流程，做一个简明通俗的解释，主要参考材料为R

WebService中注解开发，CXF，Spring整合，Rest风格

2019考研英语一 Text1分析

windows下安装docker详细步骤

CentOS 7/6系统升级内核版本到5.2.2

每日归档

更多

2024-08-05(0)

2024-08-04(0)

2024-08-03(0)

2024-08-02(0)

2024-08-01(0)

2024-07-31(0)

2024-07-30(0)

2024-07-29(0)

2024-07-28(0)

2024-07-27(0)