思绪

时间:2024-03-04 04:07:40
【文件属性】:

文件名称:思绪

文件大小:185KB

文件格式:ZIP

更新时间:2024-03-04 04:07:40

SRE-思想,最佳做法和框架 由于我具有大规模自动化的背景,因此经常有人要求我提供有关SRE实践的建议。 幸运的是,我与业务中一些最好的SRE一起工作,包括 -Google Cloud Platform开发人员倡导者。 1.第一个问题 当我遇到询问SRE的客户或同事时,我总是会问这些初始问题: 您是如何得知上次中断的? 对您的客户有什么影响? 您的组织如何回应? 2.什么是SRE 站点可靠性工程(SRE)是一组原则,实践和组织结构,旨在平衡服务的可靠性与持续交付新功能的需求。 REAL定义。 是的,它是由Google创建的。 将操作视为软件问题时,您将获得SRE。 使用代码来获取可用性,延迟,性能和容量。 需要记住的一些事情: 任何系统最重要的功能是可靠性。 我们的监控不仅会因为我们的用户而决定我们的可靠性。 可靠性来自于出色的工程软件,运营和业务的together 。


【文件预览】:
sre_thoughts-main
----images()
--------readme.md(1B)
--------dickersons-hierarchy-of-service-reliability.png(184KB)
----README.md(4KB)

网友评论