1.close nouveau
终端输入:sudo gedit /etc/modprobe.d/blacklist.conf
末尾加两行
blacklist nouveau
options nouveau modeset=0
然后保存
之后运行这行命令
sudo update-initramfs -u
重启,然后运行:
lsmod | grep nouveau
结果应该不会显示任何东西
2.Install NVIDIA Driver
查看显卡型号和推荐的显卡驱动(显卡驱动的版本直接就决定了cuda的版本,而cuda版本也就决定了cudnn和tensorflow的版本,所以显卡驱动务必安装正确)
ubuntu-drivers devices
安装驱动,方式一(取决于下载速度,通常会很慢):
# 将系统中存在的nvidia驱动全部卸载掉(如果有的话)
sudo apt-get purge nvidia*
# 添加ppa源并更新
sudo add-apt-repository ppa:graphics-drivers/ppa
sudo apt-get update
# 安装nvidia-390版本
sudo apt-get install nvidia-390
方式二:打开 Software & Updates ,点击”Additional Drivers” ,选择第一个选项Using NVIDIA driver metapackage from nvidia-driver-390(这种方式 取决于下载速度,通常会很慢)
方式三:从官网下载驱动文件NVIDIA-Linux-x86_64-390.116.run,然后手动安装(主要安装驱动需要gcc-7,和make)
sudo apt install gcc
sudo apt install g++
sudo apt install make
sudo chmod +x
NVIDIA-Linux-x86_64-390.116.run
sudo ./
NVIDIA-Linux-x86_64-390.116.run
-no-nouveau-check -no-opengl-files
-no-nouveau-check
:安装驱动时禁用
nouveau
-no-opengl-files:只安装驱动文件,不安装
OpenGL
文件
测试是否安装成功
nvidia-smi
3.Install CUDA9.0
降级gcc,由于cuda-9.0只支持gcc-6.0以下的版本,而Ubuntu18.04系统默认安装的gcc-7.3版本,所以需要降级为gcc-5,
sudo apt install gcc-5
sudo apt install g++-5
转至/usr/bin/ 目录下,创建软链接至gcc-5版本
sudo mv gcc gcc.bak #备份
sudo ln -s gcc-5 gcc
sudo mv g++ g++.bak
sudo ln -s g++-5 g++
下载run file (cuda_9.0.176_384.81_linux.run)
sudo chmod +x cuda_9.0.176_384.81_linux.run
sudo ./cuda_9.0.176_384.81_linux.run –override
注意:
--override is necessary.
When installing, it will ask you whether install driver either. Answer NO because you have install it earlier!
4.Install cudnn7
tar -xzvf cudnn-9.0-linux-x64-v7.tgz
sudo cp cuda/include/cudnn.h /usr/local/cuda/include
sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64
sudo chmod a+r /usr/local/cuda/include/cudnn.h /usr/local/cuda/lib64/libcudnn*
修改环境变量
sudo vi ~/.bashrc
export PATH=/usr/local/cuda/bin${PATH:+:${PATH}}
export LD_LIBRARY_PATH=/usr/local/cuda/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}
export CUDA_HOME=/usr/local/cuda
更新系统环境变量
source /etc/profile
检查cuda的安装结果:nvcc -V
5. Install tensorflow
由于安装的是cuda9.0,选择tensorflow_gpu-1.5.0-cp36-cp36m-linux_x86_64.whl,最新版本的tensorflow-gpu与cuda9.0不兼容
先安装 Anaconda3:
下载地址:https://www.anaconda.com/download/
根据系统选择对应的安装包(
下载完成后,cd到存放目录并执行: bash Anaconda3-xxxx.sh #xxxx此处对应自己的包
按照提示安装即可,安装路径可以选择默认。
安装完之后执行:
source ~/.bashrc
检查是否安装成功
终端执行:conda list
若提示命令无法找到,则修改.profile文件:
sudo gedit ~/.profile
添加以下几行:
if [ -d "$HOME/anaconda3/bin" ] ; then
PATH="$HOME/anaconda3/bin:$PATH"
fi
使生效:
source
~
/
.profile
创建
tensorflow
环境
conda create -n tensorflow pip python=3.6 #python
版本根据要安装的
tensorflow
选择
激活环境:
source activate tensorflow
安装tensorflow:
pip install tensorflow_gpu-1.5.0-cp36-cp36m-linux_x86_64.whl
安装过程中会下载其他的依赖包,下载可能会很慢,可以先把相关依赖包安装完,再安装tensorflow。
例如,pip install numpy -i http://pypi.douban.com/simple/
镜像源:
清华:https://pypi.tuna.tsinghua.edu.cn/simple
阿里云:http://mirrors.aliyun.com/pypi/simple/
中国科技大学 https://pypi.mirrors.ustc.edu.cn/simple/
华中理工大学:http://pypi.hustunique.com/
山东理工大学:http://pypi.sdutlinux.org/
豆瓣:http://pypi.douban.com/simple/
若需要安装Keras,则tensorflow1.5.0版本对应的Keras版本为2.1.4
可直接 pip install keras==2.1.4进行安装,此时keras后端是tensorflow,如需要将后端改为Theano,则需要安装Theano,然后修改Keras的配置文件
pip install Theano
配置:
将“tensorflow”修改为“theano”
验证安装
终端输入:python
然后输入以下代码:
import tensorflow as tf
import keras
import theano 没有错误就可以了。
创建
pytorch
环境
conda create -n pytorch pip python=3.6
激活环境:
source activate pytorch
安装
numpy
pip install numpy
安装
pytorch
:
由于直接在线下载安装很慢
,所以需要先把
torch-1.0.0-cp36-cp36m-linux_x86_64.whl
文件下载下来
,然后离线安装
pip install torch-1.0.0-cp36-cp36m-linux_x86_64.whl