llama2前脚刚开源我后脚就试试搭建70B - 代码天地

llama2前脚刚开源我后脚就试试搭建70B

企业开发 2023-08-01 19:49:14 阅读次数: 0

1 申请下载模型权限

https://ai.meta.com/resources/models-and-libraries/llama-downloads/

稍微认证填一填，我这次大概10分钟左右给我通过了

邮件内容如下：

2 下载llama源码

git clone [email protected]:facebookresearch/llama.git

3 下载模型

使用源码里面的download.sh进行下载

如下图

第一步让你输入邮件里面那个授权url，很长，https://download.llamameta.net开头

第二步让你输入想要下载的模型名称，这里下载的是70B-chat

之后会下载几个LICENSE和tokenizer.model等

再之后就是我们最需要的模型文件了。如下图

4 下载花絮

2023-7-22 11:20:30，开始下载的时候是2023-7-21 17:30，过去这么久，下载了不少模型了，但是刚刚发现报错了。。。。

不知道能不能继续

然后重新执行download.sh脚本，发现会重新下载已经下载过的模型，ε=(´ο｀*)))唉！！！！

只能改下源码，跳过已经下载过的。

我这里原本下载好了00 01 02 03 04 05 06，07也有，由于07是最后一个，不确定下载完成没，所以也当做没下载，另外00在我重试download.sh脚本的时候覆盖了，也是不完整的，所以我把download.sh脚本改为如下图

if [[ $s != "01" && $s != "02" && $s != "03" && $s != "04" && $s != "05" && $s != "06" ]]

wget xxxx

fi

2023-7-22 14:50:21总算下载完成

模型大概129G

5 跑官方demo

2023-7-24 22:10

官方说了这里需要8个MP，所以我跑的时候指定了8个GPU

CUDA_VISIBLE_DEVICES=1,2,3,4,6,7,8,9 torchrun --nproc_per_node 8 --master_port=29501 example_chat_completion.py --ckpt_dir llama-2-70b-chat/ --tokenizer_path tokenizer.model --max_seq_len 512 --max_batch_size 4

启动命令后，查看GPU状态，如下图

查看终端输出

很顺利的运行了！

6 微调

后续补充

猜你喜欢

转载自blog.csdn.net/wade1010/article/details/131857538

llama2前脚刚开源我后脚就试试搭建70B

使用ExLlamaV2在消费级GPU上运行Llama2 70B

Meta开源Code Llama 70B,缩小与GPT-4之间的技术鸿沟

【AI实战】开源中文 llama2 来了，30 分钟搭建 130 亿参数大模型 Llama2-Chinese-13b-Chat

基于Llama2模型的开源模型

Llama2~baby

LLaMa2

Llama2技术细节&开源影响

阿里云通义千问14B模型开源！性能超越Llama2等同等尺寸模型

Firefly-LLaMA2-Chinese - 开源中文LLaMA2大模型

国内最大Llama开源社区发布首个预训练中文版Llama2

llama2模型下载

Baichuan2开源大模型正式发布，王小川：性能超过LLaMA2

LLMs之LLaMA2：LLaMA2的简介(技术细节)、安装、使用方法(开源-免费用于研究和商业用途)之详细攻略

使用 Docker 快速上手中文版 LLaMA2 开源大模型

使用 Docker 快速上手官方版 LLaMA2 开源大模型

Llama2开源大模型的新篇章以及在阿里云的实践

如何让 Llama2、通义千问开源大语言模型快速跑在函数计算上？

使用DPO微调Llama2

Llama2 指令精调脚本

[NLP]llama2模型下载地址

打起来了~ 最小SOTA模型：Mistral 7B，各方面碾压LLaMA2 13B和LLaMA1 34B

度小满“轩辕70B”金融大模型开源！登顶两大权威测评榜单，所有用户均可下载...

开源第一！元象国产大模型在权威评测超越Llama2和百川

一文就懂大语言模型Llama2 7B+中文alpace模型本地部署

千亿大模型开源共训，打造中国的LLAMA70B

我从在 Ubuntu Linux 上的传统 CPU 架构上尝试运行 Llama2 中学到了什么

Meta 的新 Llama2 发布让您兴奋不已

llama2本地CPU推理运行

关于中文LLaMA2的一些不错的工作

今日推荐

周排行

四大线程池详解

如何高效使用Vim

Mogodb的常用操作总结

Spyder默认页面布局调整

SAR日志分析

OAuth是一个关于授权（authorization）的开放网络标准，在全世界得到广泛应用，目前的版本是2.0版。本文对OAuth 2.0的设计思路和运行流程，做一个简明通俗的解释，主要参考材料为R

WebService中注解开发，CXF，Spring整合，Rest风格

2019考研英语一 Text1分析

windows下安装docker详细步骤

CentOS 7/6系统升级内核版本到5.2.2

每日归档

更多

2024-08-05(0)

2024-08-04(0)

2024-08-03(0)

2024-08-02(0)

2024-08-01(0)

2024-07-31(0)

2024-07-30(0)

2024-07-29(0)

2024-07-28(0)

2024-07-27(0)