Zookeeper之Leader选举过程

时间:2021-08-29 10:15:17

Leader在集群中是一个非常重要的角色,负责了整个事务的处理和调度,保证分布式数据一致性的关键所在。既然Leader在ZooKeeper集群中这么重要所以一定要保证集群在任何时候都有且仅有一个Leader存在。

概念

Zookeeper Server三种角色:Leader,Follower,Observer。

Leader是Zookeeper 集群工作机制的核心,主要工作:

  • a.调度者:集群内部各个服务节点的调度者
  • b.事务请求:事务请求的唯一调度和处理者,保证集群事务处理的顺序性

Follower主要职责:

  • a.非事务请求:Follower 直接处理非事务请求,对于事务请求,转发给 Leader
  • b.Proposal 投票:Leader 上执行事务时,需要 Follower 投票,Leader 才真正执行
  • c.Leader 选举投票

Observer主要职责:

  • a.非事务请求:Follower 直接处理非事务请求,对于事务请求,转发给 Leader

Observer 跟 Follower的区别:

  • a.Follower 参与投票:Leader 选举、Proposal 提议投票(事务执行确认)
  • b.Observer 不参与投票:只用于提供非事务请求的处理

Zookeeper Server的状态

  • LOOKING:寻找Leader
  • LEADING:Leader状态,对应的节点为Leader。
  • FOLLOWING:Follower状态,对应的节点为Follower。
  • OBSERVING:Observer状态,对应节点为Observer,该节点不参与Leader选举。

其它概念

  • ZXID(zookeeper transaction id):每个改变Zookeeper状态的操作都会形成一个对应的zxid,并记录到transaction log中。 这个值越大,表示更新越新
  • myid:服务器SID,一个数字,通过配置文件配置,唯一
  • SID:服务器的唯一标识
  • 成为Leader的必要条件: Leader要具有最高的zxid;当集群的规模是n时,集群中大多数的机器(至少n/2+1)得到响应并follow选出的Leader。
  • 心跳机制:Leader与Follower利用PING来感知对方的是否存活,当Leader无法相应PING时,将重新发起Leader选举。

选举有两种情况,一是服务器启动的投票,二是运行期间的投票。

服务器启动时期的Leader选举

1.每个服务器发送一个投票(SID,ZXID)

其中sid是自己的myid,初始阶段都将自己投为Leader。

2.接收来自其他服务器的投票。

集群的每个服务器收到投票后,首先判断该投票的有效性,如检查是否是本轮投票、是否来自LOOKING状态的服务器。

3.处理投票

针对每个投票都按以下规则与自己的投票PK,PK后依据情况是否更新投票,再发送给其他机器。

  • a.优先检查ZXID,ZXID较大者优先为Leader
  • b.如果ZXID相同,检查SID,SID较大者优先为Leader

5.统计投票

每次投票后,服务器统计所有投票,判断是否有过半的机器收到相同的投票,如果某个投票达到一半的要求,则认为该投票提出者可以成为Leader。

6.改变服务器状态

一旦确定了Leader,每个服务器都更新自己的状态,Leader变更为Leading,Follower变更为Following
正常情况下一旦选出一个Leader则一直会保持,除非Leader服务器宕掉,则再进行重新选举。

服务器运行时期的Leader选举

1.变更状态

当Leader宕机后,余下的所非Observer的服务器都会将自己的状态变更为Looking,然后开启新的Leader选举流程。

2.每个服务器发出一个投票。

生成(SID,ZXID)信息,注意运行期间的ZXID可能是不同的,但是在投票时都会将自己投为Leader,然后发送给其他的服务器。

3.接收来自各个服务器的投票

与启动时过程相同

4.处理投票

与启动时过程相同

5.统计投票

与启动时过程相同

6.改变服务器状态

与启动时过程相同

资料