pythorch显卡利用率过低的问题

编程语言 2020-01-14 18:01:48 阅读次数: 0

在docker中pytorch显卡利用率过低的问题

刚刚在用docker利用用pytorch训练模型的时候报了一个错：RuntimeError: DataLoader worker (pid 493) is killed by signal: Bus error. Details are lost due to multiprocessing. Rerunning with num_workers=0 may give better error trace.

一开始是因为在训练的时候发现显卡的利用率太低了，显卡有一半的时间处于空闲状态，这不行啊，这得训练到何年何月去了，猜测应该是CPU预处理数据耗费了太多时间导致的，于是把DataLoader的num_workers参数设置为8，然后就报了上面那个错误，于是google查了一下，这应该是设置了num_works不为0的时候，导致docker和宿主计算机的共享内存不够了，于是就报了这个错，怎么解决呢？在创建docker的时候加上–shm-size=16G这个参数就ok啦。于是显卡利用率基本都能保持在99%这样了，当然会有点波动，训练速度提升了不少。

ogzhen

发布了4 篇原创文章 · 获赞 0 · 访问量 209

私信关注

猜你喜欢

转载自blog.csdn.net/ogzhen/article/details/103977490

pythorch显卡利用率过低的问题

显卡罢工，显卡利用率低，游戏帧率上不去

关于独显A卡利用率一直是0不运行的问题

1253: 磁带最大利用率问题

Network自身能力利用率问题

信道利用率

资源利用率

XYNUOJ 1253: 磁带最大利用率问题

Java 应用中高 CPU 利用率问题的定位

windows如何查看nvidia显卡（GPU）的利用率和温度

CPU利用率编程

表空间利用率

"sar"工具利用率

监控CPU利用率

GPU利用率忽高忽低

windows10下如何查看nvidia显卡（GPU）的利用率和温度（以及显卡正常温度的范围）

windowsCPU利用率100%爆了爆了

MongoDB CPU利用率高原因

CPU利用率与Load Average的区别

CPU利用率与Load Average的区别？

oracle 表空间利用率的查询

oracle表空间利用率

Swap空间利用率不释放

通信原理-频带利用率

keras 提高 GPU利用率

cpu利用率和load

时间利用率太低了

GPU利用率低的原因

IRQ 提升CPU利用率

以太网的信道利用率

今日推荐

周排行

成为C++高手之宏与枚举

在CAD二次开发中使用进度条

Js插件ECharts，HighCharts学习网址整理

Celery提交任务出错(on windows.)

cephfs内核客户端性能追踪

thinkphp中PHPExcel用法

EntityFramework动态组合多排序字段

汇编语言（八）实验9 根据材料编程

安装ubuntu后必须做的事情（对我而言）

JS函数式编程

每日归档

更多

2024-10-22(0)

2024-10-21(0)

2024-10-20(0)

2024-10-19(0)

2024-10-18(0)

2024-10-17(0)

2024-10-16(0)

2024-10-15(0)

2024-10-14(0)

2024-10-13(0)