ubuntu本身拥有开源的集成显卡驱动程序nouveau,先屏蔽nouveau,再安装NVIDIA官方驱动。
查看属性
ls -lh /etc/modprobe.d/blacklist.conf
查看是否屏蔽了nouveau(命令没有输出就行)
lsmod | grep nouveau
查看GPU型号
lspci | grep -i nvidia
查看nvidia驱动版本
dpkg --list | grep nvidia-*
卸载原有的nvidia驱动
apt-get remove --purge nvidia*
下载nvidia官方驱动文件,安装nvidia驱动
./NVIDIA-Linux-x86_64-390.77.run -no-opengl-files -no-nouveau-check -no-x-check
./NVIDIA-Linux-x86_64-390.77.run -no-opengl-files
cudn安装(相关补丁类似)
cd /data/bigData/nvidia_driver_390.77 -- 自己的个人安装文件目录
chmod +x ./cuda_9.0.176_384.81_linux.run
sh ./cuda_9.0.176_384.81_linux.run
cudnn安装(假定cudn已经安装在/usr/local/cuda/目录下)
cp cudnn-9.0-linux-x64-v7.solitairetheme8 cudnn-9.0-linux-x64-v7.tgz
tar -xvf cudnn-9.0-linux-x64-v7.tgz //解压结果位于当前目录的cuda目录下
在解压的目录下(当前目录的cuda目录):
cp cuda/include/*.h /usr/local/cuda/include/
cp cuda/lib64/lib* /usr/local/cuda/lib64/
(以下的3步在重新安装cudnn时可以省略)
chmod +r libcudnn.so.7.0.5
ln -s libcudnn.so.7.0.5 libcudnn.so.7
ln -s libcudnn.so.7 libcudnn.so
ldconfig -- 立刻生效动态链接库
Note:
ldconfig是一个动态链接库管理命令,实现动态链接库的系统共享。
禁止ubutnu系统自动更新
less /etc/apt/apt.conf.d/10periodic
检查系统内核版本
uname -sr
遇到的几个问题
1)安装nvidia驱动之后,输入nvidia-smi,没有输出显卡的相关信息
解决方案:重新安装nvidia驱动,中间有一步提示“是否restart x”,选择“yes”
2)"Would you like to register the kernel module sources with DKMS?This will allow DKMS to auomatically build a new module,if you install a different kernel later"问题:
选择 NO!
3)“Loaded runtime CuDNN library: 7101 (compatibility version 7100)”的cudnn版本问题:
解决方案:重新安装cudnn,需要在官网下载对应的v7.0的驱动(笔者安装的7.04),可以解决问题
4)频繁的调用和暂停显卡,比如频繁使用nvidia-smi,会导致rpa-**问题
解决方案:未找到解决方法,查阅资料说可能是显卡本身的硬件问题。