环境为ubuntu16.04,显卡驱动版本384.130.由于CUDA、CUDNN、显卡驱动、tensorflow-gpu版本都要相互对应才能正常工作。所以这里我选择了cuda8.0,cudnn6,tensorflow-gpu1.4.0一套。以下为详细过程。
一、下载cuda8和cudnn6
1.下载cuda8.0
由于驱动版本为384.130,这里选择CUDA8.0GA2.
以下为对照表
CUDA历史版本下载地址
我下载了cuda_8.0.61_375.26_linux.run
2.下载cudnn6
cudnn下载地址要先注册,然后选择合适的版本即可
我这里选择了cudnn-8.0-linux-x64-v6.0.solitairetheme8
二、上传至远程服务器并配置
1.安装cuda
(1)上传至服务器后,进入该文件存放文件夹,运行以下命令
filename.run指刚才上传到服务器上的cuda_8.0.61_375.26_linux.run
chmod +x filename.run
然后
./filename.run
(2)同意协议(accept),不安装driver(no),选择安装cuda时个人用户的目录,如/home/yourname/cuda8,下一个选项(no),然后可以选择cudasamples的安装目录。其他直接回车即可
2.安装cudnn
(1)先将cudnn-8.0-linux-x64-v6.0.solitairetheme8转化为cudnn-8.0-linux-x64-v6.0.tgz,并解压(会自动解压到cuda文件夹下)
cp cudnn-8.0-linux-x64-v6.0.solitairetheme8 cudnn-8.0-linux-x64-v6.0.tgz
tar zxvf cudnn-8.0-linux-x64-v6.0.tgz
(2)运行以下命令,将相关文件拷贝到cuda8文件夹下(cuda8代指安装cuda时选择的个人用户目录/home/yourname/cuda8)
cp cuda/include/cudnn.h cuda8/include/
cp cuda /lib64/libcudnn* cuda8/lib64
chmod a+r cuda9/include/cudnn.h cuda8/lib64/libcudnn*
3.配置环境变量
环境变量文件 /.bashrc位于home/yourname//.bashrc(用vi ~/.bashrc编辑)
加上以下两句
以下cuda8在我这里指代/home/yourname/cuda8(替换成cuda所在的文件夹路径即可)
export PATH=“cuda8/bin:$PATH”
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:cuda8/lib64/
添加完保存后退出,然后运行以下命令使环境变量生效
source ~/.bashrc
三、查看cuda和cudnn版本
以下cuda8仍然指代cuda的安装路径
cat cuda8/version.txt
cat cuda8/include/cudnn.h | grep CUDNN_MAJOR -A 2
四、安装anaconda3
去清华镜像下载了Anaconda3-4.2.0-Linux-x86_64.sh,然后上传至服务器
输入以下命令进行安装
bash Anaconda3-4.2.0-Linux-x86_64.sh
协议一路回车,加yes即可
五、安装tensorflow-gpu1.4.0
各版本对应关系如下图,根据前面安装的cuda和cudnn版本,这里选择安装tensorflow-gpu1.4.0
然后添加pip清华源,由于前面已经安装好了cuda和cudnn,这里直接使用pip命令安装tensorflow-gpu相关版本即可
安装完成写一个小程序测试即可~