pytorch冻结网络参数，requires_grad与optimizer顺序的关系 - 代码天地

pytorch冻结网络参数，requires_grad与optimizer顺序的关系

企业开发 2023-04-09 06:16:09 阅读次数: 0

问题说明：

pytorch迁移学习时，需要对某些层冻结参数，不参与方向传播，具体实现是将要冻结的参数的requires_grad属性置为false，然后在优化器初始化时将参数组进行筛选，只加入requires_grad为True的参数，代码示例如下：

cnn = CNN() #构建网络

for n,p in cnn.named_parameters():
    print(n,p.requires_grad)
    if n=="conv1.0.weight":
        p.requires_grad = False

optimizer = torch.optim.Adam(filter(lambda p: p.requires_grad,cnn.parameters()), lr=learning_rate)

但是如果把requires_grad属性置为false这个操作放在optimizer之后，会不会有影响，这个指定层的参数会不会被冻结呢？代码示例如下：

cnn = CNN() #构建网络

optimizer = torch.optim.Adam(filter(lambda p: p.requires_grad,cnn.parameters()), lr=learning_rate)

for n,p in cnn.named_parameters():
    print(n,p.requires_grad)
    if n=="conv1.0.weight":
        p.requires_grad = False

经过打印每次迭代后参数组中的参数值，可以得出结论：

1、把requires_grad属性置为false的操作放在optimizer初始化之后，也可以达到参数被冻结的效果（该指定要冻结的层的参数完全没变化）

2、区别在于，先进行requires_grad属性置为false的操作，再optimizer初始化，不会将该层的参数放进优化器中更新，而先进行optimizer初始化，再进行requires_grad属性置为false的操作，会将所有的参数放进优化器中，但不更新该指定层参数，只更新剩下的参数。对比看来，optimizer中的参数量会相比前者会更大一点。

猜你喜欢

转载自blog.csdn.net/sinat_33486980/article/details/117952661

pytorch冻结网络参数，requires_grad与optimizer顺序的关系

pytorch迁移学习中parameters requires_grad=False和optimizer优化参数的探讨

PyTorch冻结网络参数

小知识点系列(二十) 本文(2万字) | 解读预训练 | 微调 | 迁移 | 模型冻结与解冻 | 对比优化器optimizer与requires_grad冻结 | PyTorch断点训练 |

pytorch中的 requires_grad和volatile

2018.11.14——pytorch中的grad_fn，requires_grad

pytorch冻结网络模型参数(迁移学习)

Pytorch训练过程中改变模型参数 requires_grad 属性

pytorch学习笔记——requires_grad和volatile

pytorch笔记：06)requires_grad和volatile

Pytorch-创建requires_grad=True的tensor

PyTorch学习笔记(1)——requires_grad和autograd.no_grad

关于pytorch当中的model.eval()和requires_grad=False

【PyTorch 计算图】requires_grad=True的leaf variable及其设计逻辑

param.grad、requires_grad、grad_fn、grad/梯度为None？

torch.tensor默认requires_grad=False

torch.Tensor.requires_grad_(requires_grad=True)的使用说明

pytoch 设置了requires_grad=True，但是计算梯度(grad)为none

什么时候该用with torch.no_grad()？什么时候该用.requires_grad ==False?

torch.nn.parameter 生成可更新的 tensor （requires_grad = True）

Pytorch 中model.zero_grad 和optimizer.zero_grad等效

【pytorch】冻结、固定部分参数

【Pytorch进阶】Pytorch冻结部分层的参数

Pytorch中的optimizer.zero_grad和loss和net.backward和optimizer.step的理解

Pytorch 为什么每一轮batch需要设置optimizer.zero_grad

pytorch 提取网络中的某一层并冻结其参数

pytorch如何冻结某层参数的实现

pytorch bug: a leaf Variable that requires grad has been used in an in-place operation

pytorch 更新部分参数（冻结参数）注意事项

神经网络冻结层，固定参数

今日推荐

周排行

四大线程池详解

如何高效使用Vim

Mogodb的常用操作总结

Spyder默认页面布局调整

SAR日志分析

OAuth是一个关于授权（authorization）的开放网络标准，在全世界得到广泛应用，目前的版本是2.0版。本文对OAuth 2.0的设计思路和运行流程，做一个简明通俗的解释，主要参考材料为R

WebService中注解开发，CXF，Spring整合，Rest风格

2019考研英语一 Text1分析

windows下安装docker详细步骤

CentOS 7/6系统升级内核版本到5.2.2

每日归档

更多

2024-08-05(0)

2024-08-04(0)

2024-08-03(0)

2024-08-02(0)

2024-08-01(0)

2024-07-31(0)

2024-07-30(0)

2024-07-29(0)

2024-07-28(0)

2024-07-27(0)