高可用Keepalived 和 Heartbeat 的比较

时间:2021-04-17 03:17:16

一、区别

两款高可用开源方案:Keepalived和Heartbeat。两者都很流行,将资源(ip以及程序服务等资源)从一台已经故障的计算机快速转移到另一台正常运转的机器上继续提供服务,一般称之为高可用服务。

heartbeat和keepalived有很多相同之处,但是也有区别:

(1)Keepalived使用更简单:从安装、配置、使用、维护等角度上对比,Keepalived都比Heartbeat要简单

(2)Heartbeat功能更强大:Heartbeat虽然复杂,但功能更强大,配套工具更全,适合做大型集群管理,而Keepalived主要用于集群倒换,基本没有管理功能;

(3)协议不同:Keepalived使用VRRP协议虚拟路由冗余协议(Virtual Router Redundancy Protocol,简称VRRP,l思科交换就是使用这个协议做双机)进行通信和选举。Heartbeat使用心跳(IBM POWER小型机就是用心跳线做双机)进行通信和选举;Heartbeat通过网络或串口通信


二、工作原理:


(主备模式)一台heartbeat服务器作为主服务器,另一台自动成为热备服务器。在热备服务器上面配置heartbeat守护程序来监听来自主服务器的心跳信息。如果在规定时间内,无法监听到心跳信息,那么就启动故障转移,取得主服务器上的相关资源的所有权,接替主服务器继续不间断的提供服务,从而达到资源以及服务高可用的目的。

(主主模式)heartbeat还支持主主模式,及两台服务器互为主备。一般故障切换时间在5~20s之间。

(1)服务器宕机
        1、heartbeat软件故障
        2、心跳连接线故障
        3、服务故障不会导致切换,可以通过服务宕机把heartbeat服务停掉。
(2)两台heartbeat服务之间通信:
        1、串行电缆,服务器上装专门串口卡(距离不能太远,一般是上下机架位)
        2、交叉网线分别直连服务器的两块网卡
        3、通过交换机用网线连接。(受交换机故障影响)


(3)Heartbeat裂脑(splitbrain)

       两台服务器在一定时间内,无法相互检测到对方心跳而各自启动故障转移功能,取得资源和服务的所有权,会导致同一个IP在两端同时启动服务,存在两个相同的VIP,造成冲突的严重问题。

(4)裂脑的原因
       1、心跳链路故障,导致无法正常通信
       2、开启了防火墙阻挡了心跳信息传输
       3、心跳网卡地址等配置不正确
       4、心跳方式,心跳广播冲突,软件bug
(5)防止裂脑方案:
      1、 同时使用串行电缆和以太网电缆连接,同时使用两条心跳线
      2、 检测到裂脑时,强制关闭一个节点。
      3、 做好监控预警

      4、仲裁机制(确定让那个节点接管服务)

(6)消息类型:
        1、心跳消息(单播,广播或者多播):150字节的数据包
        2、集群转换消息:ip-request,ip-request-rsp
        3、重传消息:rexmit-request

三、IP地址接管和故障转移:

heartbeat通过ip地址接管和arp广播进行故障转移的。

ARP广播:在主服务器故障时,备用节点接管资源后,会立即强制更新所有客户端本地的arp表(即清楚客户端本地缓存的故障服务器的vip和mac地址的解析记录),确保客户端和新的主服务器的对话。
 
实IP,又被称为管理ip,一般指配置在物理网卡上面的ip。在负载均衡高可用环境中,管理IP是不对外提供访问服务的。仅仅作为管理服务器使用,如SSH可以通过这个进行服务连接管理。

VIP是虚拟ip,实际上就是eth0:X,x为0~255的任意数字,你可以在一个网卡上面绑定多个别名。VIP当主服务器故障时,可以自动漂移到备用服务器。