清华GLM部署记录 - 代码天地

清华GLM部署记录

编程语言 2023-10-01 07:27:45 阅读次数: 0

环境部署

首先安装anaconda（建议包管理比较方便）windows用户需手动配置一下环境变量，下面默认是在ubuntu环境说明
创建python环境，conda create -n your_env_name python=3.10 (注：官方是提供是python3.8，但目前主流用python3.10 因此使用python3.10. your_env_name 是可以自己命名的环境名字 )
导入需要的包，这里包版本的参考，在附件中的requirements.txt, 可以使用pip install -r requirements.txt

拉取github项目

git clone https://github.com/chatchat-space/langchain-ChatGLM.git
cd langchain-ChatGLM
启动webui：如果是ubuntu 可以直接运行命令
```
python webui.py 
```
启动api接口：如果是ubuntu 可以直接运行命令
```
python api.py
```
多卡启动，在命令前面指定CUDA_VISIBLE_DEVICES=0,1 类似这样如：
```
CUDA_VISIBLE_DEVICES=0,1,2,3 python api.py
```

可能遇到的问题

默认直接运行命令时，第一次将会从huggingface上下载模型，可能遇到网络连接的问题，解决方案如下：
- 重新运行，因为有断点重连，所以就不停的重新运行直到下完模型权重就行，默认地址为~/.cache/huggingface/hub/models–模型名称
- 打开huggingface，搜索要下载的模型，在Files and versions中将模型都下载到本地，目录结构为
  
  .
  └── 模型文件夹
  ├── added_tokens.json
  ├── config.json
  ├── configuration_codet5p_embedding.py
  ├── merges.txt
  ├── modeling_codet5p_embedding.py
  ├── pytorch_model.bin
  ├── special_tokens_map.json
  ├── tokenizer.json
  ├── tokenizer_config.json
  └── vocab.json
  
  然后在langchain-ChatGLM/config/model_config.py 中配置local_model_path 字段为模型文件夹所在的路径

更多说明

可以使用fastchat 部署做到模型和api在不同的服务器（或相同服务器）

参考连接 https://github.com/lm-sys/FastChat/blob/main/docs/openai_api.md#restful-api-server

猜你喜欢

转载自blog.csdn.net/Climbman/article/details/133457936

清华GLM部署记录

GLM

GLM 大加强，清华团队推出 GLM 联网加强版 WebGLM！

清华glm团队新作：多模态的VisualGLM-6b

GLM-130B本地部署的实战方案

清华 chatglm 本地部署

【报告】从GLM-130B到ChatGLM：大模型预训练与微调学习记录

清华集训2017刷题记录

清华集训2014 做题记录

清华集训2016做题记录

Ubuntu设置清华源(学习内容记录)

OpenGL GLM 环境配置

GLM：链接与分发

Transform using the glm library

论文阅读_GLM

【OpenGL】glm库的配置

清华大学开源的chatGLM-6B部署实战

使用anaconda部署清华开源ChatGLM-6B

中断的概念和机制————（清华大学慕课记录）

记录“conda添加清华镜像源”问题--查看添加删除

tomcat部署记录tip

JSPWiki源码部署记录

mhn 实际部署记录

Linux 环境部署记录

MYSQL CLUSTER 部署记录

jenkins部署记录

Kubernetes 的部署记录

jdk部署记录

rabbitmq部署记录一

jenkins部署使用记录

今日推荐

周排行

深度学习------Lingvo框架下的加速通道GPipe

webjars管理静态资源

C专家编程_2.2

mysql 源码安装

json文件操作

123231432

注解的实现

Spring MVC 控制器

《人月神话》读后感二

C#使用HttpWebRequest和HttpWebResponse上传文件示例

每日归档

更多

2024-09-08(0)

2024-09-07(0)

2024-09-06(0)

2024-09-05(0)

2024-09-04(0)

2024-09-03(0)

2024-09-02(0)

2024-09-01(0)

2024-08-31(0)

2024-08-30(0)