文件名称:阿里巴巴在混沌工程领域的实践和思考
文件大小:523KB
文件格式:PDF
更新时间:2024-02-17 05:54:29
阿里巴巴在混沌工程领域的实践和思考
混沌工程(ChaosEngineering):是在分布式系统上进行实验的学科,目的是建立对系统抵御生产环境中失控条件的能力以及信心。最早由Netflix及相关团队提出。故障演练(MonkeyKing):是阿里巴巴在混沌工程领域的产品,目标是沉淀通用的故障模式,以可控成本在线上重放,以持续性的演练和回归方式运营来暴露问题,不断推动系统、工具、流程、人员能力的不断前进。混沌工程、故障注入和故障测试在关注点和工具中都有很大的重叠。混沌工程和其他方法之间的主要区别在于,混沌工程是一种生成新信息的实践,而故障注入是测试一种情况的一种特定方法。当您想要探索复杂系统可能出现的不良行为时,注入通信延迟和