Nvidia自带的nvidia-smi命令行工具,可以查看GPU的使用情况:
nvidia-smi
使用watch指令可以周期监控GPU的使用情况:
watch -n 10 nvidia-smi
-n选项后面指定执行命令的周期,以s为单位。
显示的信息分为两部分:
- 第一部分:各块GPU使用情况,比如温度,显存,GPU利用率
- 第二部分(Processes):使用GPU的进程及占用显存大小
第一部分表头说明:
- Fan:显示风扇转速,数值在0到100%之间,是计算机的期望转速,如果计算机不是通过风扇冷却或者风扇坏了,显示出来就是N/A;
- Temp:显卡内部的温度,单位是摄氏度;
- Perf:表征性能状态,从P0到P12,P0表示最大性能,P12表示状态最小性能;
- Pwr:能耗表示;
- Bus-Id:涉及GPU总线的相关信息;
- Disp.A:是Display Active的意思,表示GPU的显示是否初始化;
- Memory Usage:显存占用情况;
- Volatile GPU-Util:浮动的GPU利用率;
- Compute M:计算模式;