踩了很多坑,综合了很多博主文章,在此表示感谢,自己记录一下这个过程。
安装这东西,谁都得踩很多坑,废话不多说,按步骤装一次就明白了,一句话:能装好就行!
(代码均以黑色加粗显示,方便查看)。
需要下载的工具(以下只针对与我同型号的朋友直接拿来用):
1. 系统对应的显卡驱动:这个需要查找自己显卡对应的驱动程序
2. Cuda
3. Cudnn
安装前查看相关信息:
# lspci | grep –i vga (查看电脑对应显卡信息)
![一文贯通 CentOS 7 下安装tensorflow-gpu 一文贯通 CentOS 7 下安装tensorflow-gpu](https://image.shishitao.com:8440/aHR0cHM6Ly9waWFuc2hlbi5jb20vaW1hZ2VzLzc4L2E1ODRhZTc5ZGVkNjI4ZTFhMTYzNDNhYmUxNDk3NmNlLnBuZw%3D%3D.png?w=700&webp=1)
# nvidia-smi (查看显卡详细信息)(如果不安装驱动并不能看到内容)
![一文贯通 CentOS 7 下安装tensorflow-gpu 一文贯通 CentOS 7 下安装tensorflow-gpu](https://image.shishitao.com:8440/aHR0cHM6Ly9waWFuc2hlbi5jb20vaW1hZ2VzLzgyNy9kMjMyMGFlOWYwZmEyMzNjN2YyMzA2ZDU3ZWUzM2M0Yi5wbmc%3D.png?w=700&webp=1)
![一文贯通 CentOS 7 下安装tensorflow-gpu 一文贯通 CentOS 7 下安装tensorflow-gpu](https://image.shishitao.com:8440/aHR0cHM6Ly9waWFuc2hlbi5jb20vaW1hZ2VzLzE5LzQ1Y2IxODQ4MTkxOTM4ZmE2MDg5ZTA1Yzg5MGJjMDBiLnBuZw%3D%3D.png?w=700&webp=1)
![一文贯通 CentOS 7 下安装tensorflow-gpu 一文贯通 CentOS 7 下安装tensorflow-gpu](https://image.shishitao.com:8440/aHR0cHM6Ly9waWFuc2hlbi5jb20vaW1hZ2VzLzM4OC80MzlmNTk2M2RjMTc4ZDlhM2JlM2Y3MjJlZmI1ODg5NC5wbmc%3D.png?w=700&webp=1)
安装前的准备工作:
# yum upgrade
# yum groupinstall"Developmenttools" (这一步有可能报错或者显示不存在啥的,不用管他)
# yum install wget gcc make epel-release -y (这一步有可能报错或者显示不存在啥的,不用管他)
# yum install zlib-develbzip2-developenssl-devel ncurses-devel SQLite-devel readline-devel tk-develgdbm-develxz-devel systemtap-sdt-devel -y
# yumupgrade
安装gcc、g++编译器(如果已经安装好了的话,会提示“无需任何安装”的字样)
# yum install gcc
安装kernel-devel和kernel-headers(如果已经安装好了的话,会提示“无需任何安装”的字样)
# sudo yum install epel-release
# yum install --enablerepo=epel dkms
安装显卡驱动和 Cuda:
都按照默认制定的选项安装就好:
# sh ./NVIDIA-Linux-x86_64-375.66.run
# sh cuda_8.0.61_375.26_linux.run
安装好后还需要修改配置文件:
#gpu driver
export CUDA_HOME=/usr/local/cuda-8.0
exportPATH=/usr/local/cuda-8.0/bin:$PATH
exportLD_LIBRARY_PATH=/usr/local/cuda-8.0/lib64:$LD_LIBRARY_PATH
exportLD_LIBRARY_PATH="/usr/local/cuda-8.0/lib:${LD_LIBRARY_PATH}"
修改之后需要**所修改的配置文件:
接下来就可以通过查看显卡信息测试驱动是否安装成功:
![一文贯通 CentOS 7 下安装tensorflow-gpu 一文贯通 CentOS 7 下安装tensorflow-gpu](https://image.shishitao.com:8440/aHR0cHM6Ly9waWFuc2hlbi5jb20vaW1hZ2VzLzk5MS9kOTMzYzFmMTE3ZjRhMjUxOGI1Zjg5MDVmYmRiOTlhZi5wbmc%3D.png?w=700&webp=1)
有显示,说明显卡驱动安装成功,继续闯关!
测试CUDA是否安装成功:
# cd /usr/local/cuda/samples/
如果安装成功了的话,上面这个文件夹是可以进去的
# make(这步运行时间比较长,不要以为存在问题)
# ./bin/x86_64/linux/release/deviceQuery
#./bin/x86_64/linux/release/bandwidthTest
显示 Result = PASS 则测试通过
安装CUDNN
$ tar -zxvf cudnn-8.0-linux-x64-v6.0.tgz
$ cd cuda
$ cp include/* /usr/local/cuda-8.0/inlcude/
这个就比较简单了!
进入环境:
# source activate tensorflow
# pip install tensorflow_gpu-1.2.0-cp36-cp36m-manylinux1_x86_64.whl
报错:
1. 最常用也最容易忽略的解决方法:
$reboot(重启)
很多安装都是在重启之后才起效果,所以如果按照代码都运行了还报错,那就重启再试试;
2.
Installing the NVIDIAdisplay driver...
The driver installationis unable to locate the kernel source. Please make sure that the kernel sourcepackages are installed and set up correctly.
If you know that thekernel source packages are installed and set up correctly, you may pass thelocation of the kernel source with the '--kernel-source-path' flag.
解决方法:
sudo yum install epel-release
yum install --enablerepo=epel dkms