RTX30系列-Ubuntu系统配置与深度学习环境Pytorch配置

本文完成RTX3090Windows+Ubuntu双系统配置，并配置深度学习环境

硬件环境为RTX3090+Z590主板，64GB RAM，2TB固态，8TB存储
Ubuntu系统版本为：Ubuntu 20.04.3 LTS
深度学习环境：cuda11.0.4；cudnn8.2.4；pytorch1.9

一、制作启动盘

1.下载ISO镜像

去官方网站根据需求下载镜像，我这里下载的是Ubuntu 20.04.3 LTS

2.下载烧录工具UltraISO

3.制作Ubuntu启动盘

以管理员身份打开UltraISO

RTX30系列-Ubuntu系统配置与深度学习环境Pytorch配置

文件->打开->找到下载的镜像

RTX30系列-Ubuntu系统配置与深度学习环境Pytorch配置

启动->写入硬盘镜像，点击写入

RTX30系列-Ubuntu系统配置与深度学习环境Pytorch配置

有警告选择yes，U盘会被格式化，要做好文件备份

RTX30系列-Ubuntu系统配置与深度学习环境Pytorch配置

最后U盘内容变成这样就算成功了

RTX30系列-Ubuntu系统配置与深度学习环境Pytorch配置

二、安装Ubuntu系统

1.初始操作

如果电脑之前安装过Ubuntu系统，先把之前的分区删掉

比如我这里这几个主分区都是之前安装Ubuntu16的，点击删除卷全部删掉

RTX30系列-Ubuntu系统配置与深度学习环境Pytorch配置

删除后变成这样就可以了，注意NTFS为系统盘，千万不要删

RTX30系列-Ubuntu系统配置与深度学习环境Pytorch配置

如果之前没有安装过，就选择一个卷进行压缩，给Ubuntu分配系统空间，我这里给分了2TB，可以根据自己的空闲空间大小进行分配。

2.设置启动顺序

设置U盘的启动顺序为1，然后保存并重启

RTX30系列-Ubuntu系统配置与深度学习环境Pytorch配置

选择Ubuntu

RTX30系列-Ubuntu系统配置与深度学习环境Pytorch配置

等待磁盘检查

RTX30系列-Ubuntu系统配置与深度学习环境Pytorch配置

3.进行安装

安装

安装Ubuntu，为了方便展示，我这里选择了中文，后面最好改回英文，以避免发生不必要的错误，有的数据集代码什么的遇到中文路径就会报错。

RTX30系列-Ubuntu系统配置与深度学习环境Pytorch配置

键盘布局

RTX30系列-Ubuntu系统配置与深度学习环境Pytorch配置

联网

什么网络都不要连，最好把网线也拔了，不然安装会很慢，不要网离线安装几分钟就结束了。

更新和其他软件

RTX30系列-Ubuntu系统配置与深度学习环境Pytorch配置

安装类型

这里选择其他进行自定义分区，千万不要选第二项

RTX30系列-Ubuntu系统配置与深度学习环境Pytorch配置

找到刚才分配的空闲分区，选中并点击+创建挂载点

RTX30系列-Ubuntu系统配置与深度学习环境Pytorch配置

挂载点/

参考Ubuntu20.04从零开始安装（Win10双系统）_pt3_的博客-CSDN博客

1	swap区	16g(内存大小1.5倍)	逻辑分区	空间起始位置	交换空间
2	/	30g	主分区	空间起始位置	etx4
3	/boot	2g	逻辑分区	空间起始位置	etx4
4	/home	52g	逻辑分区	空间起始位置	etx4

/boot - 200 MB ；实际需求大约 100 ~ 200MB，如果有多个内核/启动镜像同时存在，建议分配 200 或者 300 MB。(个人建议:200MB ~ 300MB)

/ - 15-20 GB ；主分区，默认ext4，15-20 GB 对于大多数用户来说是一个比较合适的取值。(个人建议：15G短时间用不完，长期使用的话，建议20GB~25GB)

/home - [不定] ；通常用于存放用户数据，下载的文件和媒体文件。在桌面系统中，/home 通常是最大的文件系统。(个人建议: 多多益善)

swap - [不定] ；逻辑分区，在拥有不足 512 MB 内存的机器上，通常为 swap 分区分配2倍内存大小的空间。如果有更大的内存（大于 1024 MB），可以分配较少的空间甚至不需要swap 分区。(个人建议：感觉现在电脑的配置可以不要swap，但是也会用的着的，所以还是建议多少分点

我这里因为分的空间比较大，所以就给的比较随意了

RTX30系列-Ubuntu系统配置与深度学习环境Pytorch配置

挂载点swap

RTX30系列-Ubuntu系统配置与深度学习环境Pytorch配置

挂载点/boot

忘了拍照了....，照着上面分就行

挂载点/home

把剩下的全分给home

RTX30系列-Ubuntu系统配置与深度学习环境Pytorch配置

引导启动

选择/boot对应的sda，然后进行安装

RTX30系列-Ubuntu系统配置与深度学习环境Pytorch配置

地区与用户

RTX30系列-Ubuntu系统配置与深度学习环境Pytorch配置

安装完成后重启

RTX30系列-Ubuntu系统配置与深度学习环境Pytorch配置

接下来就可以使用了

注意事项及总结

一开始我安装的是16版本，后来安装好之后分辨率不对，去NVIDIA官网安装驱动后好了，网卡驱动有问题，不管是启动盘自带的驱动还是网上说的e1000，还去找了Z590主板上的网卡型号，下载驱动都没办法用，一直连不上网，后来不用电脑以太网口，用USB扩展网口连接上网线可以用，但网络十分不稳定，过几分钟就会掉线，必须重启服务才行，还有其他各种各样的问题，迫不得已现在安装了一个新点的Ubuntu，安装好问题都解决了，界面也更精美，3090和老版本的Ubuntu适配还是有点问题，这也给自己长了一个教训。

三、配置深度学习环境

1.显卡驱动

禁用nouveau驱动

sudo vim /etc/modprobe.d/blacklist.conf

添加

blacklist nouveau
options nouveau modeset=0

RTX30系列-Ubuntu系统配置与深度学习环境Pytorch配置

后执行：

sudo update-initramfs -u

重启后，执行以下命令，如果没有屏幕输出，说明禁用nouveau成功：

lsmod | grep nouveau

RTX30系列-Ubuntu系统配置与深度学习环境Pytorch配置

卸载旧驱动

以下操作都需要在命令界面操作，执行以下快捷键进入命令界面，并登录：

记录一个大坑

以下是Ubuntu16的命令

Ctrl+Alt+F1

按下后就跟cmd一样，不要慌，想回到图形化界面按：

Ctrl+Alt+F7

这里先不回去，以下命令在命令行界面执行：

tty1命令行界面：

Ctrl+Alt+F3

图形化界面

Ctrl+Alt+F1

我开始按半天都进行不去还以为出啥问题了。

以下是Ubuntu20的命令
执行以下命令禁用X-Window服务，否则无法安装显卡驱动：

sudo service lightdm stop

执行以下三条命令卸载原有显卡驱动：

sudo apt-get remove --purge nvidia*
sudo chmod +x NVIDIA-Linux-x86_64-410.93.run
sudo ./NVIDIA-Linux-x86_64-410.93.run --uninstall

安装新驱动

RTX30系列-Ubuntu系统配置与深度学习环境Pytorch配置

也可以直接通过命令进行安装

RTX30系列-Ubuntu系统配置与深度学习环境Pytorch配置

下载完run文件后，在命令行界面进行下面操作

直接执行驱动文件即可安装新驱动，一直默认即可：

sudo ./NVIDIA-Linux-x86_64-410.93.run

执行以下命令启动X-Window服务

sudo service lightdm start

The distribution-provided pre-install script failed! Are you sure you want to continue?

选择 continue

RTX30系列-Ubuntu系统配置与深度学习环境Pytorch配置

Would you like to register the kernel module souces with DKMS? This will allow DKMS to automatically build a new module, if you install a different kernel later?

选择 No 继续。

Nvidia's 32-bit compatibility libraries?

选择 No 继续。

Would you like to run the nvidia-xconfigutility to automatically update your x configuration so that the NVIDIA x driver will be used when you restart x? Any pre-existing x confile will be backed up.

选择 Yes 继续

最后执行重启命令，重启系统即可，通过nvidia-smi进行检验，输出下列信息就说明安装成功了。

检查

通过nvidia-smi检查，输出显卡信息就安装成功了。

RTX30系列-Ubuntu系统配置与深度学习环境Pytorch配置

2.CUDA安装

按照自己的版本进行选择，依次执行以下第一条命令进行安装即可。

RTX30系列-Ubuntu系统配置与深度学习环境Pytorch配置

下载完成之后，先给文件赋予执行权限

sudo chmod +x cuda_xxxx_linux.run

然后执行安装包，开始安装：

sudo ./cuda_xxxxxlinux.run

RTX30系列-Ubuntu系统配置与深度学习环境Pytorch配置

按回车不要Driver，否则会覆盖原先的驱动，可能会出错。

RTX30系列-Ubuntu系统配置与深度学习环境Pytorch配置

3.配置环境变量

安装完cuda还无法使用，需要配置环境变量

gedit ~/.bashrc
# 文本最后添加以下内容：
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda/lib64
export PATH=$PATH:/usr/local/cuda/bin
export CUDA_HOME=$CUDA_HOME:/usr/local/cuda
# 保存退出，打开新终端激活
source ~/.bashrc

PS:这个路径不一定，我这里是cuda，有的是cuda11.0，有的是cuda10的，根据实际路径修改，

配置完后通过nvcc -V检查，打印下列信息配置成功

RTX30系列-Ubuntu系统配置与深度学习环境Pytorch配置

4.cudnn

RTX30系列-Ubuntu系统配置与深度学习环境Pytorch配置

在官网下载

解压后执行下面命令，注意这里的路径会根据版本不同不一样，和cuda类似，根据实际情况修改

sudo cp cuda/include/cudnn.h /usr/local/cuda/include
sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64
sudo chmod a+r /usr/local/cuda/include/cudnn.h /usr/local/cuda/lib64/libcudnn*

5.Pytorch

先将下载源改为清华源

conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/conda-forge/
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/msys2/
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/bioconda/
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/menpo/
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/pytorch/
conda config --set show_channel_urls yes

我这里用的是Anaconda进行环境配置的，这个比较方便管理，首先创建环境：

conda create -n pt1.9 python=3.7

激活环境后，输入命令安装

conda install pytorch torchvision torchaudio cudatoolkit=11.1 -c nvidia

安装完成后再根据需求安装一些需要的包，如numpy，matplotlib，opency-python等

然后通过以下代码测试环境是否搭建成功：

import torch
print(torch.cuda.is_available())

print(torch.version)

输出以下信息就算搭配好了,之后就可以跑深度学习的代码了

RTX30系列-Ubuntu系统配置与深度学习环境Pytorch配置

6.将向日葵设置为开机默认启动

由于经常用到远程，就使用了向日葵作为远程访问工具，在软件中设置了开机启动，但是发现没有生效，开机后还是需要手动启动

RTX30系列-Ubuntu系统配置与深度学习环境Pytorch配置

故通过设置应用首选项添加其为开机启动选项。

首先在命令行中输入以下命令进入设置界面

gnome-session-properties

RTX30系列-Ubuntu系统配置与深度学习环境Pytorch配置

然后点击Add进行添加，Name和Comment随便填，Command需要输入应用路径，除了向日葵也可以添加别的开机启动应用，路径如果不清楚可以用下方命令进行查看

dpkg -L sunloginclient

找别的应用可以更换名称就行

RTX30系列-Ubuntu系统配置与深度学习环境Pytorch配置

最后点击Save保存即可。

7.为Pycharm创建快捷方式

安装完Pycharm后发现启动没有快捷方式，非常麻烦，所以特地记录一下创建过程。

首先进入安装的pycharm路径bin下，找到pycharm.sh，先用./ pycharm.sh运行启动pycharm

RTX30系列-Ubuntu系统配置与深度学习环境Pytorch配置

启动后在界面的Tools下有个Create Desktop Entry，点击创建

RTX30系列-Ubuntu系统配置与深度学习环境Pytorch配置

然后就能生成桌面快捷方式了，上面那个方框不要勾选

RTX30系列-Ubuntu系统配置与深度学习环境Pytorch配置

还可以创建命令行启动方式，跟sh启动差不多

RTX30系列-Ubuntu系统配置与深度学习环境Pytorch配置

秒客网

RTX30系列-Ubuntu系统配置与深度学习环境Pytorch配置

一、制作启动盘

1.下载ISO镜像

2.下载烧录工具UltraISO

3.制作Ubuntu启动盘

二、安装Ubuntu系统

1.初始操作

2.设置启动顺序

3.进行安装

安装

键盘布局

联网

更新和其他软件

安装类型

挂载点/

挂载点swap

挂载点/boot

挂载点/home

引导启动

地区与用户

注意事项及总结

三、配置深度学习环境

1.显卡驱动

禁用nouveau驱动

卸载旧驱动

安装新驱动

检查

2.CUDA安装

3.配置环境变量

4.cudnn

5.Pytorch

6.将向日葵设置为开机默认启动

7.为Pycharm创建快捷方式

相关文章