Linux下安装Keepalived及原理分析

时间:2022-04-10 18:27:31

1、keepalived 原理

1、keepalived是什么

keepalived是集群管理中保证集群高可用的一个服务软件,其功能类似于heartbeat,用来防止单点故障。

2、keepalived工作原理

keepalived是以vrrp协议为实现基础的,vrrp全称virtual router redundancy protocol,即虚拟路由冗余协议。

虚拟路由冗余协议,可以认为是实现路由器高可用的协议,即将n台提供相同功能的路由器组成一个路由器组,这个组里面有一个master和多个backup,master上面有一个对外提供服务的vip(该路由器所在局域网内其他机器的默认路由为该vip),master会发组播,当backup收不到vrrp包时就认为master宕掉了,这时就需要根据vrrp的优先级来选举一个backup当master。这样的话就可以保证路由器的高可用了。

keepalived主要有三个模块,分别是core、check和vrrp。core模块为keepalived的核心,负责主进程的启动、维护以及全局配置文件的加载和解析。check负责健康检查,包括常见的各种检查方式。vrrp模块是来实现vrrp协议的。

3、keepalived的配置文件

keepalived只有一个配置文件keepalived.conf,里面主要包括以下几个配置区域,分别是global_defs、static_ipaddress、static_routes、vrrp_script、vrrp_instance和virtual_server

2、keepalived 在linux下的安装

1、准备工作

linux主机:10.122.111.80 、
linux主机:10.122.111.81、
虚拟ip:10.122.111.99、
操作系统:银河麒麟 v3.3

2、安装keepalived

两台linux主机都需要安装keepalived,如下步骤两台机需要重复进行。

1、下载keepalived

下载至目录:/home/zz/user/software

wget http://keepalived.org/software/keepalived-1.3.8.tar.gz

2、解压keepalived

tar -zxvf keepalived-1.3.8.tar.gz

3、配置keepalived

cd keepalived-1.3.8/

./configure

此步骤可能出现错误,

checking libnfnetlink/libnfnetlink.h usability... no

checking libnfnetlink/libnfnetlink.h presence... no

checking for libnfnetlink/libnfnetlink.h... no

configure: error: libnfnetlink headers missing

如下图:

Linux下安装Keepalived及原理分析

解决方法如下:

将 usr.zip 包解压至keepalived-1.3.8目录,解压,然后执行

cp -r usr/ /

成功后,重新执行

./configure

成功,如下图:

Linux下安装Keepalived及原理分析

 4、编译安装keepalived

make
make install

3、配置防火墙

firewall-cmd --direct --permanent --add-rule ipv4 filter input 0 \ --in-interface p4p1 --destination 224.0.0.18 --protocol vrrp -j accept

firewall-cmd --direct --permanent --add-rule ipv4 filter output 0 \ --out-interface p4p1 --destination 224.0.0.18 --protocol vrrp -j accept

firewall-cmd --reload

注意:上述【p4p1】为配置的网卡名称。

4、配置服务启动

cp /home/zz/user/software/keepalived-1.3.8/keepalived/etc/init.d/keepalived /etc/init.d/
mkdir /etc/keepalived
cp /usr/local/etc/keepalived/keepalived.conf /etc/keepalived/

执行完成后,即可使用服务的形式启动keepalived,如下:

service keepalived start

如果使用 service keepalived status命令查看状态出现如下问题:

/etc/init.d/keepalived:行15: /etc/sysconfig/keepalived: 没有那个文件或目录

则需要执行:

ln -s /usr/local/etc/sysconfig/keepalived /etc/sysconfig/

执行成功后,重启keepalived服务,即可查看状态。

如果keepalived启动不成功,错误信息如下:

keepalived_vrrp exited with permanent error config. terminating

说明keepalived 核心配置文件配置有误,继续往下配置即可,此问题先不用处理。

5、配置双机

keepalived配置文件为:/etc/keepalived/keepalived.conf,

现进行如下配置:

使用10.122.111.80 为主节点,

使用10.122.111.81为从节点 进行配置,

修改主节点80的配置文件 keepalived.conf,内容修改如下所示:

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
! configuration file for keepalived
 global_defs {
  notification_email {
   # acassen@firewall.loc
   # failover@firewall.loc
   # sysadmin@firewall.loc
  }
  notification_email_from alexandre.cassen@firewall.loc
  # smtp_server 192.168.200.1
  # smtp_connect_timeout 30
  router_id server_1
  vrrp_skip_check_adv_addr
  vrrp_garp_interval 0
  vrrp_gna_interval 0
 }
 vrrp_instance vi_1 {
   state master
   interface p4p1
   virtual_router_id 55
   priority 100
   protocol tcp
   advert_int 1
   authentication {
     auth_type pass
     auth_pass 1111
   }
   virtual_ipaddress {
     10.122.111.99/24
   }
 }

修改从节点81的配置文件 keepalived.conf,内容修改如下所示:

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
! configuration file for keepalived
 global_defs {
  notification_email {
   # acassen@firewall.loc
   # failover@firewall.loc
   # sysadmin@firewall.loc
  }
  notification_email_from alexandre.cassen@firewall.loc
  # smtp_server 192.168.200.1
  # smtp_connect_timeout 30
  router_id server_2
  vrrp_skip_check_adv_addr
  vrrp_garp_interval 0
  vrrp_gna_interval 0
 }
 vrrp_instance vi_1 {
   state backup
   interface p4p1
   virtual_router_id 55
   priority 50
   protocol tcp
   advert_int 1
   authentication {
     auth_type pass
     auth_pass 1111
   }
   virtual_ipaddress {
     10.122.111.99/24
   }
 }

配置完成后,分别启动 keepalived,并进行状态查看,如下图:

Linux下安装Keepalived及原理分析

 6、配置非抢占模式

keepalived默认为抢占模式,主节点master在故障回复重新开启使用时会掠夺当前从服务器的虚拟ip,重新占据中心地位,在一个去中心化的集群中,可配置非抢占模式,即正在处于服务状态的主机虚拟ip不会被抢走知道此台服务器出现问题。

只需要在原有master配置文件中修改如下配置即可(backup节点无需更改):

nopreempt

state backup

调整后的配置文件如下:

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
! configuration file for keepalived
 global_defs {
  notification_email {
   # acassen@firewall.loc
   # failover@firewall.loc
   # sysadmin@firewall.loc
  }
  notification_email_from alexandre.cassen@firewall.loc
  # smtp_server 192.168.200.1
  # smtp_connect_timeout 30
  router_id server_1
  vrrp_skip_check_adv_addr
  vrrp_garp_interval 0
  vrrp_gna_interval 0
 }
 vrrp_instance vi_1 {
   state backup  # 此处由master调整为backup
   nopreempt    # 此处添加非抢占模式配置
   interface p4p1
   virtual_router_id 55
   priority 100
   protocol tcp
   advert_int 1
   authentication {
     auth_type pass
     auth_pass 1111
   }
   virtual_ipaddress {
     10.122.111.99/24
   }
 }

 7、查看虚拟ip指向

判断当前服务器是否拥有虚拟ip,执行如下命令,如果有结果则说明当前服务器正处于服务状态,如果查询为空,则说明当前服务器不用有虚拟ip,处于备用状态。

ip addr|grep 10.122.111.99

Linux下安装Keepalived及原理分析

说明当前服务器拥有虚拟ip。

8、如何判断脑裂?

分别在两台机查看当前服务器是否拥有虚拟ip,如果两台服务器都拥有,则说明发生了脑裂,证明目前双机通信出现问题,产生此问题的原有在于 两台服务器都探测不到组内其他服务器的状态(心跳请求无法正常响应),私自判定另一台服务器挂起,则抢占虚拟ip,脑裂的出现是不被允许的,解决此问题的方法为检查防火墙设置(关闭防火墙)或者使用串口通信。