刚开始跑模型遇到了很多问题,感谢大神们的博客,自己对遇到的问题做个小总结~
一、tmux的使用:
1.新开一个会话---tmux new -s session_name
2.会话里启动进程后,回到原本界面的方法----先按下ctrl+b,然后再单独按d
3.重新回到会话里查看进程的方法:tmux a -t session_name
4.查看会话中历史记录----先按ctrl+b,然后按Page Up ,Page Down
5.可以同时新建多个会话s1,s2,s3
在会话间切换的命令: 先按ctrl+b ,再按s,然后就可以在会话间选择其中一个,按enter进入。
6.关闭会话的方法: tmux kill -session -t session_name
这里注意:有时ctrl+b没反应,是因为输入法在中文模式,调成英文模式就好啦
二、显卡占用问题
程序终止,但显卡仍然占用:
1.查看占用显卡的进程
fuser -v /dev/nvidia*
2.终止进程
kill -9 pid
三、执行脚本时 没有那个文件或目录
出现这个错误是因为不熟练linux编程,每次都从本机写好再上传服务器。 这是由于脚本文件在保存时使用了DOS文件(windows系统中)格式造成的,可以用vim打开文件,然后执行下列操作:
:set ff=unix
:wq
所以一定要好好熟练linux语法啊啊啊
四、卸载tensorflow
pip uninstall protobuf
pip uninstall tensorflow
五、Linux下环境变量PATH设置错误,导致:未找到命令
export PATH=/usr/local/sbin:/usr/local/bin:/sbin:/bin:/usr/sbin:/usr/bin
echo $PATH
然后
vim ~/.bash_profile
添加PATH
六、pytorch 多GPU训练
CUDA_VISIBLE_DEVICES=2 python 程序名
https://oldpan.me/archives/pytorch-to-use-multiple-gpus 这篇更详细一些,谢谢博主~~~///(^v^)\\\~~~