摘要:本文介绍了昇腾平台日志分类、日志级别设置、日志内容格式,以及如何获取日志文件的方法。
本文分享自华为云社区《如何查看并读懂昇腾平台的应用日志》,作者:昇腾CANN。
当您完成训练/推理工程开发后,将工程放到昇腾平台运行,以调试工程是否正常运行,此时,可能会出现各种各样、五花八门的异常状况。
当问题发生时,我们的第一反应是不是查看日志,看看哪里报错了。昇腾平台有哪些日志呢?日志文件又在哪呢?本期带您了解如何使用昇腾平台的日志功能。
01 了解日志分类
根据工程运行过程中日志产生的场景不同,日志通常被分为以下4类:
- 调试日志(debug):记录调试级别的相关信息,一般用于跟踪运行路径,如记录函数的进入和退出等,大部分为代码级的信息输出,调试日志用于开发人员定位复杂问题。
- 操作日志(operation):记录设备操作维护人员下发或通过设置相关的自动化任务下发的操作和操作结果。
- 安全日志(security):记录系统用户登录、注销和鉴权,增加、删除用户,用户的锁定和解锁,角色权限变更,系统相关安全配置(如安全日志内容配置)变更等活动。
- 运行日志(run):记录系统的运行状况或执行流程中的一些关键信息,包括异常的状态、动作,关键的事件等。
02 如何获取日志文件
我们现在知道了昇腾AI处理器有4类日志,那我们需要到哪里查看这些日志呢?本节来揭秘。
昇腾AI处理器具有EP和RC两种形态,针对不同的硬件形态,日志文件存放位置不同,需根据实际硬件形态获取。
EP场景日志获取
- 应用类日志
用户应用进程在Host侧和Device侧产生的日志。例如,一个推理/训练任务下发后,通常与本次推理/训练直接相关的日志都存放在应用类日志中。
这类日志默认存放在“$HOME/ascend/log”路径下,格式如下:
├── debug
│ ├── device-0
│ │ └── device-pid_*.log //Device侧产生的日志
│ └── plog
│ └── plog-pid_*.log //Host侧产生的日志
├── operation
│ ├── device-0
│ │ └── device-pid_*.log
│ └── plog
│ └── plog-pid_*.log
├── run
│ ├── device-0
│ │ └── device-pid_*.log
│ └── plog
│ └── plog-pid_*.log
└── security
├── device-0
│ └── device-pid_*.log
└── plog
└── plog-pid_*.log