mxnet使用记录

1、在服务器上跑时,在要运行的py文件上,在import os和import mxnet前加上os.environ['MXNET_GPU_MEM_POOL_RESERVE'] = '95'能使模型所占内存更稳定,加上os.environ['MXNET_ENABLE_GPU_P2P'] = '0'

2、训练的时候报错:

terminate called after throwing an instance of 'dmlc::Error'
what():  [23:11:43] src/engine/./threaded_engine.h:359: [23:11:43] src/operator/nn/./cudnn/cudnn_convolution-inl.h:628: Check failed: e == CUDNN_STATUS_SUCCESS (2 vs. 0) cuDNN: CUDNN_STATUS_ALLOC_FAILED

导致训练中断这是因为我们的Gpu内存不够,可以换一个内存更大的GPU,更简单的办法是将batch_size减小。具体可参考https://github.com/apache/incubator-mxnet/issues/2025

3、http://blog.csdn.net/sunshine_in_moon/article/details/52936088这个博客列举了很多mxnet可能出现的问题,可以参考。

猜你喜欢

转载自blog.csdn.net/kkkkkkkkq/article/details/79249313