文件名称:事件回顾-c# 8.0 and .net core 3.0
文件大小:3.27MB
文件格式:PDF
更新时间:2024-07-07 17:36:10
devops
7.2 事件处理 事件处理指 IT 部门各条线技术人员通过各种技术手段对事件进行分析、诊断、快速解决和恢复业 务的过程,包括事件处理机制、事件处理角色与考核两个方面,如表 7 所示。 表7 事件管理 级别 事件处理机制 事件处理角色与考核 1 事件处理无时效性要求,无重大事件处理机制。 未区分不同事件处理角色,主要根据技术 条线划分岗位。基本无 KPI 指标 2 统一定义各等级事件服务级别,基本保证达标。 有建立重大事件处理子流程。 建立服务台,并设定一、二、三线运维支持 团队。建立流程运行 KPI 指标,例如事件总 数、解决率、及时解决率。 3 有效保证各等级事件处理时效性符合服务级别要 求。重大事件应急处置机制运行顺畅,并与IT连 续性管理办法一致。 明确各团队的 KPI 考核指标。KPI 指标偏向 于如何提高系统稳定性,例如降低事件发 生数量、一线解决率等。 4 各等级事件处理时效服务级别可控。逻辑较简单 生产事件可实现自动化处理,例如故障实例自动 重启、切换等。 KPI 指标偏向于自动化事件恢复比例。 5 绝大部分生产事件无需人工参与,可自动修复, 并且业务完全无感知。 KPI 指标偏向于如何提高用户体验。 7.3 事件回顾 事件回顾指IT部门定期对周期内发生的所有事件进行总结,包括生成相关报表、服务级别达成情况 和典型案例经验分享等,旨在持续提高事件管理能效,事件回顾包括事件数量趋势、系统可用性影响和 知识管理三方面,如表7所示。 表8 事件回顾 级别 事件数量趋势 系统可用性影响 知识管理 1 随机发生,随着IT信息系统 规模扩张而指数上升。 不可预测 存在零乱知识积累行为 2 随机发生,随着IT基础设施 规模和复杂度上升而上升, 开始对重复事件进行管理。 建立可用性服务级别,但是存在 违约情况。 将重大、典型或重复故障生 成问题进行处理,并形成知 识,但分散在不同的位置存 储。