文件名称:Sia-Root:SRE事件助理的元存储库
文件大小:94KB
文件格式:ZIP
更新时间:2024-05-28 04:08:48
C#
SIA-SRE事件助理 SIA是一种新的事件管理工具,可从事件源中读取信息并推荐可帮助快速缓解事件的措施。 SIA可以从几乎任何事件流或票务系统中读取信息,并可以与许多实时站点响应模型一起使用。 问题 软件系统仅在可靠时才有效。 随着在线服务变得越来越大和越来越复杂,故障模式的潜在复杂性也随之增加。 减少灾难性故障机会的措施(例如冗余,自动缓解和节流/重试逻辑)在防止由简单的错误和硬件故障引起的中断方面非常有效,但还不能(尚未)进行调整以防止那些并非由错误引起的故障类型预期何时设计这些措施。 随着组织自动解决人员在简单故障情况下进行干预的需求,人为事件响应者可以处理最复杂,最普遍的中断。 现有工具足以应付大多数事件,但在紧急情况下无法满足要求: ,容量临界点以及其他情况,其中多个系统以无法预期的方式交互以产生问题,而又没有已知的缓解途径,尤其是在代码或配置更改可能比问题本身对用户的影响更