Peft库实战（二）：Lora微调mt5-xxl【Seq2Seq：翻译、自动摘要、信息抽取】

企业开发 2023-07-11 18:20:06 阅读次数: 0

一、Lora微调mt5-xxl

GPU要求：至少 A100-SXM4-80GB * 2

batch_size：A100-SXM4-80GB * 2情况下最大 16

备注：mt5-xxl全参数微调，batch_size=2时，A100-SXM4-80GB至少需要5张

run_finetune_lora.py

import logging
import os
import sys
import numpy as np
from datasets import Dataset
from peft import PeftModel
from peft import LoraModel, LoraConfig, get_peft_model
import random
import torch
import json
import transformers
from transformers import AutoConfig, AutoTokenizer, AutoModelForSeq2SeqLM, DataCollatorForSeq2Seq, HfArgumentParser, Seq2SeqTrainer, Seq2SeqTrainingArguments
from transformers.trainer_utils import get_last_checkpoint, is_main_process
from arguments import ModelArguments, DataTrainingArguments
from utils import get_extract_metrics_f1


os.environ["WANDB_DISABLED"] = "true"
logger = logging.getLogger("__main__&#

猜你喜欢

转载自blog.csdn.net/u013250861/article/details/131500401

Peft库实战（二）：Lora微调mt5-xxl【Seq2Seq：翻译、自动摘要、信息抽取】

创新实训（7）——有关博客摘要的抽取算法——续（基于seq2seq和attention的文档自动摘要）

机器翻译模型（MT、NMT、Seq2Seq with Attention）

Seq2Seq

seq2seq和attention应用到文档自动摘要（一）

创新实训（12）——基于seq2seq和attention的文档自动摘要（续）

使用Seq2Seq模型实现文本自动摘要：从原文到简洁概要

【文本摘要（2）】pytorch之Seq2Seq

【文本摘要（3）】Pytorch之Seq2seq: attention

Peft库实战（三）：Lora微调mt0/bloom（GPT生成式）

PyTorch: 序列到序列模型(Seq2Seq)实现机器翻译实战

【Attention演变史】翻译模型seq2seq （第二弹）

中英文翻译Seq2Seq

机器翻译概述、seq2seq、attention机制

基于seq2seq的机器翻译系统

seq2seq模型

tensorflow seq2seq

seq2seq attention

seq2seq学习

seq2seq理解

seq2seq原理

PyTorch: SEQ2SEQ

seq2seq 函数

seq2seq、attention

『RNN』SEQ2SEQ

睿智的seq2seq模型2——利用seq2seq模型实现英文到法文的翻译

NLP学习记录5——seq2seq模型

NLP学习(5)----seq2seq/transformer

Task3-5 Seq2Seq

Peft库实战（一）：Lora微调bert（文本情感分类）

今日推荐

周排行

Access的四舍五入取整

8.23 前端学习过程

入门学习过程方向与漏洞复现总结：

操作分布式文件之八：如何批量并行读写远程文件和事务补偿处理

应邀出个教程（搭建tensorflow跑网络环境）

Kubernetes之Pod控制器应用进阶

14-[mysql内置功能]--

HDU6212 区间dp 好题

VS2015生成代码图

验证手机号的工具类

每日归档

更多

2024-10-21(0)

2024-10-20(0)

2024-10-19(0)

2024-10-18(0)

2024-10-17(0)

2024-10-16(0)

2024-10-15(0)

2024-10-14(0)

2024-10-13(0)

2024-10-12(0)