【文件属性】:
文件名称:事件回顾-c# 8.0 and .net core 3.0
文件大小:3.27MB
文件格式:PDF
更新时间:2021-06-17 23:49:30
devops
7.2 事件处理
事件处理指 IT 部门各条线技术人员通过各种技术手段对事件进行分析、诊断、快速解决和恢复业
务的过程,包括事件处理机制、事件处理角色与考核两个方面,如表 7 所示。
表7 事件管理
级别 事件处理机制 事件处理角色与考核
1 事件处理无时效性要求,无重大事件处理机制。 未区分不同事件处理角色,主要根据技术
条线划分岗位。基本无 KPI 指标
2 统一定义各等级事件服务级别,基本保证达标。
有建立重大事件处理子流程。
建立服务台,并设定一、二、三线运维支持
团队。建立流程运行 KPI 指标,例如事件总
数、解决率、及时解决率。
3 有效保证各等级事件处理时效性符合服务级别要
求。重大事件应急处置机制运行顺畅,并与IT连
续性管理办法一致。
明确各团队的 KPI 考核指标。KPI 指标偏向
于如何提高系统稳定性,例如降低事件发
生数量、一线解决率等。
4 各等级事件处理时效服务级别可控。逻辑较简单
生产事件可实现自动化处理,例如故障实例自动
重启、切换等。
KPI 指标偏向于自动化事件恢复比例。
5 绝大部分生产事件无需人工参与,可自动修复,
并且业务完全无感知。
KPI 指标偏向于如何提高用户体验。
7.3 事件回顾
事件回顾指IT部门定期对周期内发生的所有事件进行总结,包括生成相关报表、服务级别达成情况
和典型案例经验分享等,旨在持续提高事件管理能效,事件回顾包括事件数量趋势、系统可用性影响和
知识管理三方面,如表7所示。
表8 事件回顾
级别 事件数量趋势 系统可用性影响 知识管理
1 随机发生,随着IT信息系统
规模扩张而指数上升。
不可预测 存在零乱知识积累行为
2 随机发生,随着IT基础设施
规模和复杂度上升而上升,
开始对重复事件进行管理。
建立可用性服务级别,但是存在
违约情况。
将重大、典型或重复故障生
成问题进行处理,并形成知
识,但分散在不同的位置存
储。