pytorch的坑---loss没写好，现存爆炸 - 代码天地

pytorch的坑---loss没写好，现存爆炸

其他 2018-05-29 14:17:15 阅读次数: 0

作者：陈诚
链接：https://www.zhihu.com/question/67209417/answer/344752405
来源：知乎
著作权归作者所有。商业转载请联系作者获得授权，非商业转载请注明出处。

算是动态图的一个坑吧。记录loss信息的时候直接使用了输出的Variable。

应该不止我经历过这个吧...

久久不用又会不小心掉到这个坑里去...

for data, label in trainloader:
    ......
    out = model(data)
    loss = criterion(out, label)
    loss_sum += loss     # <--- 这里
    ......

运行着就发现显存炸了

观察了一下发现随着每个batch显存消耗在不断增大..

参考了别人的代码发现那句loss一般是这样写 /(ㄒoㄒ)/~~

loss_sum += loss.data[0]

这是因为输出的loss的数据类型是Variable。

而PyTorch的动态图机制就是通过Variable来构建图。主要是使用Variable计算的时候，会记录下新产生的Variable的运算符号，在反向传播求导的时候进行使用。

如果这里直接将loss加起来，系统会认为这里也是计算图的一部分，也就是说网络会一直延伸变大~那么消耗的显存也就越来越大~~

总之使用Variable的数据时候要非常小心。不是必要的话尽量使用Tensor来进行计算...

包括数据的输入时候，如果“过早”把数据丢到Variable里面去，那么可能也会被系统视为网络的一部分。所以，要投入的时候再把数据丢到Variable里面去吧~

猜你喜欢

转载自blog.csdn.net/qq_27292549/article/details/80250031

pytorch的坑---loss没写好，现存爆炸

短信效果不好？是短信文案没写好！

【DeepLearning】【PyTorch ()】Pytorch Loss functions

Pytorch - Cross Entropy Loss

pytorch loss inf

Focal Loss 的Pytorch

pytorch loss function 总结

PyTorch中的Loss Fucntion

Pytorch Loss funtion介绍

pytorch loss function

pytorch的Loss函数总结

Pytorch loss相关学习

Pytorch遇到的坑：为什么模型训练时，L1loss损失无法下降？

pytorch训练模型时，因为broadcast机制踩的坑：loss无法收敛

pytorch loss function 总结 pytorch loss function 总结

pytorch产生loss的计算图

Pytorch loss function函数总结

pytorch nll loss（多类）

关于pytorch计算loss出错

Pytorch练习--绘制Loss曲线

【Pytorch】激活函数与loss的梯度

pytorch测试loss的简易方法

pytorch如何使用Focal Loss

通信原理 | 傅里叶变换(先立个贴在这，还没写好)

Pytorch_RNN_gradient exploring(梯度爆炸)

【pytorch】梯度爆炸/消失解决办法

Pytorch堆叠多个损失造成内存爆炸

GIT 写代码之前忘记PULL，写好代码PUSH时发现存在冲突（脑残式解决方案）

【损失函数：2】Charbonnier Loss、SSIM Loss（附Pytorch实现）

网站被攻击拿下—只因为程序员一个文件上传功能没写好

今日推荐

周排行

Leetcode简单题61~80

解决zookeeper磁盘IO高的问题

多线程相关方法详解

Maven-setting.xml文件详解

Maven 项目的 classpath 理解

渊亭科技大数据笔试题

配置JVM内存分配

计算机网络个人学习笔记（三）网络层：第三部分连载

js中两个等号(==)和三个等号(===)的区别

用C程序自动打开电脑上的程序

每日归档

更多

2024-09-18(0)

2024-09-17(0)

2024-09-16(0)

2024-09-15(0)

2024-09-14(0)

2024-09-13(0)

2024-09-12(0)

2024-09-11(0)

2024-09-10(0)

2024-09-09(0)