文件名称:rapid:Rapid是可扩展的分布式成员资格服务
文件大小:2.52MB
文件格式:ZIP
更新时间:2024-06-05 19:33:09
distributed-systems membership-management failure-detection strong-consistency Java
什么是快速? Rapid是一种分布式成员资格服务。 它允许一组进程轻松地形成集群并在成员资格更改时接收通知。 我们观察到,数据中心故障场景并不总是崩溃故障,而是通常涉及防火墙配置错误,单向连接丢失,可访问性触发器,以及某些(但不是全部)数据包被丢弃。 但是,尽管能够清楚地检测出崩溃故障,但是现有的成员资格解决方案仍在这些常见的失败情况下苦苦挣扎。 特别是,现有工具需要很长时间甚至永远不会收敛到消除故障过程的稳定状态。 为了解决上述挑战,我们提出了快速,可扩展的分布式成员资格系统,该系统在面对各种故障场景时保持稳定,并为参与过程提供了系统成员资格的高度一致的视图。 Rapid如何运作? Rapid通过以下三个构建块来实现其目标: 基于扩展器的监视边缘覆盖。 为了扩展监视负载,Rapid将一组过程(一种配置)组织到一个稳定的故障检测拓扑中,该拓扑包括观察者,这些观察者监视并向其主题传