在Linux上安装Cuda的问题汇总

在linux上调深度学习代码,最麻烦的就是调试老代码,需要配置各种版本的cuda。这就涉及到经常要删除cuda,重装cuda。中间有任何的错误,都可能导致前功尽弃。本文记录下我在配置cuda中遇到的问题以及各种尝试,以做备忘。

问题1. 使用deb安装cuda,版本会自动升级。

这个问题很奇怪,我按照nvidia官网上的安装方法安装cuda,下载的是10.1,结果安装完后直接变成11.4。神奇的是,我下的是local的安装包,不是在线安装。代码如下:

sudo dpkg -i cuda-repo-ubuntu1810-10-1-local-10.1.105-418.39_1.0-1_amd64.deb 
sudo apt-key add /var/cuda-repo-<version>/7fa2af80.pub`
sudo apt-get update
sudo apt-get install cuda

看了一些帖子,提示要在最后一行代码添加版本号,即:

sudo apt-get install cuda=10.1

结果安装正确,问题解决。

问题2. 卸载cuda

我看了一个帖子 (https://blog.csdn.net/weixin_42524165/article/details/112713794),介绍的方法是:

dpkg -P nvidia-cuda-toolkit nvidia-cuda-dev
apt --fix-broken install
sudo apt-get remove cuda
sudo rm /etc/apt/sources.list.d/cuda*

但是我知道一条更加直接的语句:
sudo apt  autoremove cuda

我是在管理员权限下运行的,不知道会不会有什么副作用,暂时就用这条语句。

问题3. nvcc测试没效果

修改环境变量
这里我们添加到bashrc文件: $ sudo vim ~/.bashrc
export PATH="/usr/local/cuda-8.0/bin:$PATH"
export LD_LIBRARY_PATH="/usr/local/cuda-8.0/lib:$LD_LIBRARY_PATH"
但是,之后输入nvcc -V 命令行还是显示:Command 'nvcc' not found, but can be installed with:
apt install nvidia-cuda-toolkit
这是由于环境变量的修改没有立即生效,可以使用 $ source ~/.bashrc
使修改立即生效。
原文链接:https://blog.csdn.net/Ocean_waver/article/details/102730467

猜你喜欢

转载自blog.csdn.net/aliexken/article/details/119218688