Ubuntu18.04: GPU Driver 390.116 + CUDA9.0 + cuDNN7 + tensorflow 和pytorch环境搭建

时间:2022-04-11 23:09:40

1.close nouveau

终端输入:sudo gedit /etc/modprobe.d/blacklist.conf

末尾加两行

  blacklist nouveau

  options nouveau modeset=0

然后保存

之后运行这行命令

 sudo update-initramfs -u

重启,然后运行:

 lsmod | grep nouveau

结果应该不会显示任何东西

2.Install NVIDIA Driver

查看显卡型号和推荐的显卡驱动(显卡驱动的版本直接就决定了cuda的版本,而cuda版本也就决定了cudnn和tensorflow的版本,所以显卡驱动务必安装正确)

ubuntu-drivers devices

安装驱动,方式一(取决于下载速度,通常会很慢):

# 将系统中存在的nvidia驱动全部卸载掉(如果有的话)

sudo apt-get purge nvidia*

# 添加ppa源并更新

sudo add-apt-repository ppa:graphics-drivers/ppa

sudo apt-get update

# 安装nvidia-390版本

sudo apt-get install nvidia-390

方式二:打开 Software & Updates ,点击”Additional Drivers” ,选择第一个选项Using NVIDIA driver metapackage from nvidia-driver-390(这种方式 取决于下载速度,通常会很慢)

方式三:从官网下载驱动文件NVIDIA-Linux-x86_64-390.116.run,然后手动安装(主要安装驱动需要gcc-7,和make)

sudo apt install gcc

sudo apt install g++

sudo apt install make

sudo chmod +x NVIDIA-Linux-x86_64-390.116.run

sudo ./NVIDIA-Linux-x86_64-390.116.run -no-nouveau-check -no-opengl-files

-no-nouveau-check:安装驱动时禁用nouveau
-no-opengl-files
:只安装驱动文件,不安装OpenGL文件

测试是否安装成功

nvidia-smi

3.Install CUDA9.0

降级gcc,由于cuda-9.0只支持gcc-6.0以下的版本,而Ubuntu18.04系统默认安装的gcc-7.3版本,所以需要降级为gcc-5,

sudo apt install gcc-5

sudo apt install g++-5

转至/usr/bin/ 目录下,创建软链接至gcc-5版本

sudo mv gcc gcc.bak #备份

sudo ln -s gcc-5 gcc

sudo mv g++ g++.bak

sudo ln -s g++-5 g++

下载run file (cuda_9.0.176_384.81_linux.run)

sudo chmod +x cuda_9.0.176_384.81_linux.run

sudo ./cuda_9.0.176_384.81_linux.run –override

注意:

  1. --override is necessary.

  2. When installing, it will ask you whether install driver either. Answer NO because you have install it earlier!

4.Install cudnn7

tar -xzvf cudnn-9.0-linux-x64-v7.tgz

sudo cp cuda/include/cudnn.h /usr/local/cuda/include

sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64

sudo chmod a+r /usr/local/cuda/include/cudnn.h /usr/local/cuda/lib64/libcudnn*

修改环境变量

sudo vi ~/.bashrc

export PATH=/usr/local/cuda/bin${PATH:+:${PATH}}

export LD_LIBRARY_PATH=/usr/local/cuda/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}

export CUDA_HOME=/usr/local/cuda

更新系统环境变量

source /etc/profile

检查cuda的安装结果:nvcc -V

5. Install tensorflow

由于安装的是cuda9.0,选择tensorflow_gpu-1.5.0-cp36-cp36m-linux_x86_64.whl,最新版本的tensorflow-gpucuda9.0不兼容

先安装 Anaconda3

下载地址:https://www.anaconda.com/download/

根据系统选择对应的安装包(

下载完成后,cd到存放目录并执行: bash Anaconda3-xxxx.sh #xxxx此处对应自己的包

按照提示安装即可,安装路径可以选择默认。

安装完之后执行:

source ~/.bashrc

检查是否安装成功

终端执行:conda list

若提示命令无法找到,则修改.profile文件:

sudo gedit ~/.profile

添加以下几行:

if [ -d "$HOME/anaconda3/bin" ] ; then

    PATH="$HOME/anaconda3/bin:$PATH"
fi

使生效:

source /.profile

 

创建tensorflow环境

conda create -n tensorflow pip python=3.6 #python版本根据要安装的tensorflow选择

激活环境:

source activate tensorflow

安装tensorflow:

pip install tensorflow_gpu-1.5.0-cp36-cp36m-linux_x86_64.whl

安装过程中会下载其他的依赖包,下载可能会很慢,可以先把相关依赖包安装完,再安装tensorflow。

例如,pip install numpy -i http://pypi.douban.com/simple/

镜像源:

清华:https://pypi.tuna.tsinghua.edu.cn/simple

阿里云:http://mirrors.aliyun.com/pypi/simple/

中国科技大学 https://pypi.mirrors.ustc.edu.cn/simple/

华中理工大学:http://pypi.hustunique.com/

山东理工大学:http://pypi.sdutlinux.org/

豆瓣:http://pypi.douban.com/simple/

若需要安装Keras,则tensorflow1.5.0版本对应的Keras版本为2.1.4

可直接 pip install keras==2.1.4进行安装,此时keras后端是tensorflow,如需要将后端改为Theano,则需要安装Theano,然后修改Keras的配置文件

pip install Theano

配置:

Ubuntu18.04: GPU Driver 390.116 + CUDA9.0 + cuDNN7 + tensorflow 和pytorch环境搭建

将“tensorflow”修改为“theano”

验证安装

终端输入:python

然后输入以下代码:

import tensorflow as tf
import keras
import theano 没有错误就可以了。

创建pytorch环境

conda create -n pytorch pip python=3.6

激活环境:

source activate pytorch

安装numpy

pip install numpy

安装pytorch

由于直接在线下载安装很慢,所以需要先把torch-1.0.0-cp36-cp36m-linux_x86_64.whl文件下载下来,然后离线安装

pip install torch-1.0.0-cp36-cp36m-linux_x86_64.whl