国产海光 DCU 资源监控脚本 + Promethues+grafana 深度解析

时间:2025-04-15 20:31:55

在当今数字化时代,对于服务器资源的高效监控与管理愈发重要。特别是在使用国产海光 DCU 的场景下,如何精准掌握其资源使用情况,成为了众多技术人员关注的焦点。本文将详细介绍一款国产海光 DCU 资源监控脚本,以及它与 Prometheus 和 Grafana 的结合使用,助力大家实现对 DCU 资源的全方位监控。

资源监控脚本详解

首先,我们来看核心的资源获取脚本。该脚本以 bash 语言编写,为我们获取 DCU 的各项关键指标提供了有力支持。

环境变量加载

source /root/.bashrc

这一行代码的作用是加载环境变量,确保后续脚本执行过程中,系统能够正确找到相关命令和工具的路径,为后续操作奠定基础。

获取 DCU ID

get_dcu_ids() {
echo "PATH: $PATH" > /test/promethues/node_exporter/dcu_metrics.path.txt
echo "PWD: $PWD" >> /test/promethues/node_exporter/dcu_metrics.pwd.txt

/opt/hyhal/bin/hy-smi -i | grep -vE '=|^$' | tail -n +2 | awk '{print $1}' | sed 's/DCU\[//;s/\]//'

}

get_dcu_ids函数负责获取所有 DCU 的 ID。它通过执行/opt/hyhal/bin/hy-smi -i命令,该命令用于查询 DCU 相关信息。之后,使用grep过滤掉包含