pytorch训练ubuntu卡死内存泄漏

其他 2020-08-03 20:15:52 阅读次数: 0

事件：使用pytorch进行multi-task learning，训练到30-60 epoch的时候，机器卡死了。虽然是ubuntu也卡死了

原因：一通没头没脑地分析之后，原因可能是内存泄漏。

解决：
将数据记录到log文件以提供给tensorboard可视化分析的时候，注意要在结束时关闭 SummaryWriter

writer = SummaryWriter(os.path.join(ckptDir, 'logs'))
for epoch in range(num_epochs):
	...
	    # tensorboardX
        writer.add_scalar('learning rate', lr, epoch + 1)
        writer.add_scalars('loss', {'train loss': train_loss, 'validation loss': val_loss}, epoch + 1)
        writer.add_scalars('accuracy', {'train accuracy': train_acc, 'validation accuracy': val_acc}, epoch + 1)
        writer.add_scalars('balanced accuracy', {'train bacc': train_bacc, 'validation bacc': val_bacc}, epoch + 1)

	...
# 就是这一句
writer.close()

参考：Drux @ https://stackoverflow.com/questions/44831317/tensorboard-unble-to-get-first-event-timestamp-for-run

猜你喜欢

转载自blog.csdn.net/qxqxqzzz/article/details/107354508

pytorch训练ubuntu卡死内存泄漏

有道词典导致Qt程序卡死，并且内存泄漏问题

在PyTorch训练一个epoch时，模型不能接着训练，Dataloader卡死

内存泄漏

【内存泄漏】

pytorch 1.7.0 torchvision 0.8.1 torch.cuda.amp gradscaler DDP 训练卡死

ubuntu 下安装Valgrind 内存泄漏检查工具

caffe训练中途卡死

内存溢出、内存泄漏

内存泄漏与内存溢出

内存溢出与内存泄漏

Ubuntu 界面卡死的办法

ubuntu无法关机，卡死

ubuntu关机卡死

解决 Ubuntu 经常卡死

ubuntu关机或重启卡死

Ubuntu 系统桌面卡死

C#内存泄漏--event内存泄漏

（三）内存泄漏与排查 —— 优化内存泄漏

内存泄漏场景和内存泄漏优化

【Java】内存泄漏与内存泄漏学习总结

【JVM内存泄漏】OSSClient引起的内存泄漏

什么是内存泄漏及如何防护内存泄漏

YOLOV5训练自己的数据集_pytorch_ubuntu

pytorch训练过程io性能加速技巧（ubuntu 22.04）

ThreadLocal原理及内存泄漏

Handler造成的内存泄漏

JAVA NIO内存泄漏

java 内存泄漏

Android内存泄漏总结

今日推荐

周排行

成为C++高手之宏与枚举

在CAD二次开发中使用进度条

Js插件ECharts，HighCharts学习网址整理

Celery提交任务出错(on windows.)

cephfs内核客户端性能追踪

thinkphp中PHPExcel用法

EntityFramework动态组合多排序字段

汇编语言（八）实验9 根据材料编程

安装ubuntu后必须做的事情（对我而言）

JS函数式编程

每日归档

2024-10-22(0)

2024-10-21(0)

2024-10-20(0)

2024-10-19(0)

2024-10-18(0)

2024-10-17(0)

2024-10-16(0)

2024-10-15(0)

2024-10-14(0)

2024-10-13(0)