深度学习中查看GPU的使用情况

时间:2024-03-05 22:16:32

1、首先查看显卡的情况

命令: nvidia-smi

功能:显示服务器上的GPU的情况

命令: nvidia-smi -l

功能:定时更新显示服务器上的GPU的情况

命令:watch -n 3 nvidia-smi

功能:设定刷新时间(秒)显示GPU使用情况

 

Fan:风扇速度
Temp:显卡温度
Perf:性能状态,P0最小性能,P12最大性能
Usage/Cap: 当前功耗/最大功耗
Memory-Usage:以占用显存/最大显存
GPU-Util:浮动GPU利用率
Processes:每个进程分别占用GPU的用量

  

2、如果当前默认卡的空间不够,你要换卡

import os
os.environ["CUDA_DEVICES_ORDER"]="PCI_BUS_IS"
os.environ["CUDA_VISIBLE_DEVICES"]="1" //指定使用第二块GPU

这段代码最好放在Python的最开头

在终端中可以用:

CUDA_VISIBLE_DEVICES=O,1 python3 main.py //程序只能使用GPU:0,1
CUDA_VISIBLE_DEVICES="0,1" //同上
CUDA_VISIBLE_DEVICES="" //禁止程序使用GPU

 

 

参考链接:

查看GPU的使用情况

换卡1

换卡2