Atlas800昇腾服务器(型号:3000)—驱动与固件安装(一)

时间:2024-10-20 09:32:15

服务器配置如下:

CPU/NPU:鲲鹏 CPU(ARM64)+A300I pro推理卡
系统:Kylin V10 SP1【下载链接】【安装链接
驱动与固件版本版本
Ascend-hdk-310p-npu-driver_23.0.1_linux-aarch64.run【下载链接
Ascend-hdk-310p-npu-firmware_7.1.0.4.220.run【下载链接
MCU版本:Ascend-hdk-310p-mcu_23.2.3【下载链接

1 软件包上传

将驱动包和固件包上传到服务器任意目录,如路径:/backup/work/Software_Back
在这里插入图片描述

2 驱动与固件安装

注意:以下在root用户登录执行。
进入驱动包和固件包所在目录,执行如下命令,增加驱动和固件包的可执行权限。

cd /backup/work/Software_Back
chmod +x Ascend-hdk-310p-npu-driver_23.0.1_linux-aarch64.run
chmod +x Ascend-hdk-310p-npu-firmware_7.1.0.4.220.run 

执行以下命令,完成驱动固件安装,软件包默认安装路径为“/usr/local/Ascend”。
注意:直接运行安装命令报错!!!【[ERROR]ERR_NO:0x0091;ERR_DES:HwHiAiUser not exists! Please add HwHiAiUser,需增加HwHiAiUser用户】

# 必须有HwHiAiUser用户安装,安装驱动时无需指定运行用户,默认即为HwHiAiUser【不需要su切换用户,还是在root下】。
groupadd HwHiAiUser
useradd -g HwHiAiUser -d /home/HwHiAiUser -m HwHiAiUser -s /bin/bash

# 安装驱动
./Ascend-hdk-310p-npu-driver_23.0.1_linux-aarch64.run --full --install-for-all
# 安装固件
./Ascend-hdk-310p-npu-firmware_7.1.0.4.220.run --full

# 重启系统后,以root用户登录服务器
reboot

执行npu-smi info查看驱动加载是否成功!
在这里插入图片描述

3 升级 MCU

MCU是推理卡带外管理模块,具备单板监测、故障上报等功能。出厂时推理卡已集成
了初始版本,为了保障所有功能正常使用,请将MCU升级到配套版本。
注意:以下在root用户登录执行。

3.1 上传并解压

unzip Ascend-hdk-310p-mcu_23.2.3.zip -d Ascend-hdk-310p-mcu_23.2.3

执行npu-smi info -l命令查询NPU ID
在这里插入图片描述
进入MCU软件包所在路径,执行如下命令启动升级(将NPU ID替换为上述步骤中查询到
的设备编号)。

cd Ascend-hdk-310p-mcu_23.2.3
npu-smi upgrade -t mcu -i 1 -f Ascend-hdk-310p-mcu_23.2.3.hpm
npu-smi upgrade -t mcu -i 2 -f Ascend-hdk-310p-mcu_23.2.3.hpm
npu-smi upgrade -t mcu -i 4 -f Ascend-hdk-310p-mcu_23.2.3.hpm
npu-smi upgrade -t mcu -i 5 -f Ascend-hdk-310p-mcu_23.2.3.hpm

在这里插入图片描述

执行如下命令使新版本生效,类似以下回显表示已生效

npu-smi upgrade -a mcu -i 1
npu-smi upgrade -a mcu -i 2
npu-smi upgrade -a mcu -i 4
npu-smi upgrade -a mcu -i 5

在这里插入图片描述

在生效新版本之后,等待30s,查询MCU版本号,确保升级成功。

npu-smi upgrade -b mcu -i 1
npu-smi upgrade -b mcu -i 2
npu-smi upgrade -b mcu -i 4
npu-smi upgrade -b mcu -i 5

在这里插入图片描述
在这里插入图片描述
以上,驱动与固件、MCU安装完毕!!!