DeepSpeed：ZeRO-1、ZeRO-2、ZeRO-3配置 - 代码天地

DeepSpeed：ZeRO-1、ZeRO-2、ZeRO-3配置

企业开发 2023-06-21 16:21:48 阅读次数: 0

现在的模型越来越大，动辄几B甚至几百B。但是显卡显存大小根本无法支撑训练推理。例如，一块RTX2090的10G显存，光把模型加载上去，就会OOM，更别提后面的训练优化。

作为传统pytorch Dataparallel的一种替代，DeepSpeed的目标，就是为了能够让亿万参数量的模型，能够在自己个人的工作服务器上进行训练推理。

本文旨在简要地介绍Deepspeed进行大规模模型训练的核心理念，以及最基本的使用方法。更多内容，笔者强烈建议阅读HuggingFace Transformer官网对于DeepSpeed的教程：

Transformer DeepSpeed Integration

1. 核心思想 (TLDR)

DeepSpeed的核心就在于，GPU显存不够，CPU内存来凑。

比方说，我们只有一张10GB的GPU，那么我们很可能需要借助80GB的CPU，才能够训练一个大模型。

看一下官网对于这个理念的描述：

Why would you want to use DeepSpeed with just one GPU?

It has a ZeRO-offload feature which can delegate some computatio

猜你喜欢

转载自blog.csdn.net/u013250861/article/details/131192668

DeepSpeed：ZeRO-1、ZeRO-2、ZeRO-3配置

To zero

3个错误non-zero exit value 1； non-zero exit value 2

【DeepSpeed 教程翻译】二，Megatron-LM GPT2，Zero Redundancy Optimizer 和 ZeRO-Offload

【DeepSpeed 教程】四，DeepSpeed ZeRO++博客和代码解析

zero to one(1)

zero to one (3)

zero to one (2)

1.zero-based indexing

go-zero 基础 -- 配置

Text2Video-Zero

Zero团队

zero udp

ZERO to ONE

Zero or One

/dev/zero

Program is zero,but zero is all.

volume zero VS measure zero

Raspberry Pi Zero W学习2：Python3下载安装和配置

香橙派 Orangepi Zero2配置网络SSH登录

Non-zero exit code (1)

raspberry zero w 系统安装及ssh配置

Mac配置树莓派zero usb上网

BPIM2Zero connect wifi in terminal

MySQL NO_ZERO_IN_DATE NO_ZERO_DATE

树莓派 Zero 与 Zero W 对比

ZeRO & DeepSpeed：可以让训练模型拥有超过1000亿个参数的优化（微软）

DeepSpeed之ZeRO系列：将显存优化进行到底

【深度学习】【分布式训练】DeepSpeed：AllReduce与ZeRO-DP

centos 部署 ABP Zero

今日推荐

周排行

成为C++高手之宏与枚举

在CAD二次开发中使用进度条

Js插件ECharts，HighCharts学习网址整理

Celery提交任务出错(on windows.)

cephfs内核客户端性能追踪

thinkphp中PHPExcel用法

EntityFramework动态组合多排序字段

汇编语言（八）实验9 根据材料编程

安装ubuntu后必须做的事情（对我而言）

JS函数式编程

每日归档

更多

2024-10-22(0)

2024-10-21(0)

2024-10-20(0)

2024-10-19(0)

2024-10-18(0)

2024-10-17(0)

2024-10-16(0)

2024-10-15(0)

2024-10-14(0)

2024-10-13(0)