transformers 保存量化模型并加载 - 代码天地

transformers 保存量化模型并加载

企业开发 2023-06-18 19:22:01 阅读次数: 0

from transformers import AutoTokenizer, AutoModel
from transformers.generation.utils import logger
import warnings
import time, os, torch

logger.setLevel("ERROR")
warnings.filterwarnings("ignore")

device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')

model_path = "/home/weights/nga_lora_glm/model_best"

tokenizer = AutoTokenizer.from_pretrained(model_path, trust_remote_code=True)
model = AutoModel.from_pretrained(model_path, trust_remote_code=True)

print('model load done...')

tttmp = time.time()
quantization_bit = 4
print(f"Quantized to {
      
      quantization_bit} bit")
model = model.quantize(quantization_bit)
print("model quantized done, use time: {}s".format(time.time() - tttmp))

model = model.to(device)

cur_save_dir = "/home/weights/nga_tmp_bit/"
model.save_pretrained(cur_save_dir)
tokenizer.save_pretrained(cur_save_dir)

猜你喜欢

转载自blog.csdn.net/qq_42363032/article/details/130847170

transformers 保存量化模型并加载

Transformers 保存并加载模型 | 八

transformers配置、模型加载实践

Transformers 加载预训练模型 | 七

加载预训练模型遇到transformers的问题

下载huggingface-transformers模型

nlp-with-transformers系列-03_剖析transformers模型

将transformers模型保存到本地及加载本地模型与创建CLIPProcessor实例

Transformers 多语言模型 | 十一

微调预训练模型huggingface，transformers

Transformers预训练模型使用：翻译 Translation

加载模型报错：ImportError: cannot import name ‘AlbertModel‘ from ‘transformers‘

使用 Transformers 量化 Meta AI LLaMA2 中文版大模型

transformers的bert预训练模型的返回值简要描述

基于transformers BERT预训练模型问答系统(农行知道)

Hugging Face Transformers 模型下载地址（以Pytorch Bert为例）

使用transformers框架导入bert模型提取中文词向量

huggingface NLP工具包教程1：Transformers模型

不乱码、下载 Transformers 模型 (抱抱脸、model)

【文章学习系列之模型】Non-stationary Transformers

[AI]如何让语言模型LLMs流式输出：HuggingFace Transformers实现

Transformers预训练模型使用：文本摘要 Summarization

Transformers预训练模型使用：语言建模 Language Modeling

Transformers预训练模型使用：序列分类 Sequence Classification

在PyTorch里面利用transformers的Trainer微调预训练大模型

大模型推理：transformers中的generate函数参数配置

【Python】Transformers加载BERT模型from_pretrained()问题解决

transformers 的使用

bert模型简介、transformers中bert模型源码阅读、分类任务实战和难点总结

BERT 模型微调实战：使用Transformers微调BERT模型实现问答和文本分类任务

今日推荐

周排行

四大线程池详解

如何高效使用Vim

Mogodb的常用操作总结

Spyder默认页面布局调整

SAR日志分析

OAuth是一个关于授权（authorization）的开放网络标准，在全世界得到广泛应用，目前的版本是2.0版。本文对OAuth 2.0的设计思路和运行流程，做一个简明通俗的解释，主要参考材料为R

WebService中注解开发，CXF，Spring整合，Rest风格

2019考研英语一 Text1分析

windows下安装docker详细步骤

CentOS 7/6系统升级内核版本到5.2.2

每日归档

更多

2024-08-05(0)

2024-08-04(0)

2024-08-03(0)

2024-08-02(0)

2024-08-01(0)

2024-07-31(0)

2024-07-30(0)

2024-07-29(0)

2024-07-28(0)

2024-07-27(0)