高可用集群(HA)
1. 准备工作
HA的心跳监测可以通过串口连接监测也可以通过网线监测,前者需要服务器有一个串口,后者需要有一个空闲网卡。
HA架构中需要有一个共享的存储设备
首先需要在两台机器上安装mysql服务,并架设好共享存储资源(NFS), 共享的目录应该是datadir
HA需要两台机器配置一个相同的vip
理论上每台机器要配置三个ip,一个是vip(eth0:0),一个是心跳线监测使用的ip(eth1),还有一个是服务使用的ip(eth0)
我们设定如下环境:
vip(eth0:0): 192.168.0.100
机器1 eth0:192.168.0.21 eth1: 192.168.200.128
机器2 eth0:192.168.0.22 eth1: 192.168.200.129
机器1 我们简称node1, 机器2我们简称node2
配置hosts, 两台机器一样:
192.168.0.21 node1
192.168.0.22 node2
node1 & node2 关闭防火墙,关闭selinux
配置hostname
虽然我们口头上约定好了node1 node2,但是若是主机名和这个不一致,会导致heartbeat启动不了。所以还得在每台机器上配置hostname。
2. 配置NFS安装mysql
NFS由第三台机器(192.168.0.11)提供
NFS 服务端执行:vim /etc/exports //内容如下
/data/share 192.168.0.0/24(rw,sync,no_root_squash)
NFS服务端执行命令:
/etc/init.d/rpcbind start; /etc/init.d/nfs start
node1 & node2 执行以下步骤:
mkdir -p /data/mysql
mount -t nfs 192.168.0.11:/data/share/ /data/mysql/
groupadd -g 27 mysql
useradd -u 27 -g mysql mysql
chown -R mysql:mysql /data/mysql
下载免编译的二进制mysql包
wget http://syslab.comsenz.com/downlo ... -icc-glibc23.tar.gz
tar zxvf mysql-5.1.40-linux-i686-icc-glibc23.tar.gz
mv mysql-5.1.40-linux-i686-icc-glibc23 /usr/local/mysqlcd /usr/local/mysql
cp support-files/my-large.cnf /etc/my.cnf
cp support-files/mysql.server /etc/init.d/mysqld
vim /etc/init.d/mysqld //更改datadir 以及 basedir
以下操作仅在node1上执行,node2 上不用执行这一步:
./scripts/mysql_install_db --user=mysql --datadir=/data/mysql
node1 上先启动mysql,node2上暂时先不启动:
/etc/init.d/mysqld start
注意:如果想启动node2上的mysql,必须先停掉node1上的mysql,因为这两个mysql共同用一个datadir有共享的资源,会产生冲突,而在heartbeat服务中,如果node1正常则node2默认就停止mysql服务,只有当node1宕机,node2才会自动启动mysql服务
3. 安装配置heartbeat
node1 & node2 执行:
需先安装epel扩展源:
yum install -y epel-release
yum install -y heartbeat* libnet
以下配置在node1:
cd /usr/share/doc/heartbeat-2.1.3/
cp authkeys haresources ha.cf /etc/ha.d/
cd /etc/ha.d
vim authkeys// 增加下面两行:
auth 3
3 md5 Hello!
###
保存后更改它的权限:
chmod 600 authkeys
vim haresources //增加一行:
node1 192.168.0.100/24/eth0:0 mysqld
注意:此处的启动脚本不能是软链接!!!
vim ha.cf //更改或增加如下内容
logfile /var/log/ha.log
#bcast eth1 #心跳使用以太网广播方式,eth1为广播地址
ucast eth1 192.168.200.129 #单播形式与对方机器通信,与上者二选一
keepalive 2 #每2秒发一次广播
warntime 10 # 这个时间为警告时间,10s钟内没有收到对方节点的信号,则会发警告信息记录到日志里
deadtime 30 #30s内没有收到对方节点的信号则认为对方节点宕机,然后立即接管对方节点的服务
initdead 120 #这个时间是给重启系统留出来的等待时间,如果系统重启了那么网络服务不会立即正常使用
udpport 694 # 广播通信使用的端口
auto_failback on # 如果是on, 则当主节点故障恢复后,服务还会切换回来
node node1 #主节点主机名
node node2 #从节点主机名
ping 192.168.0.1 #仲裁节点,最好是一个比较强健的设备,比如说交换机
respawn hacluster /usr/lib/heartbeat/ipfail
#当heartbeat启动时也会随着一起启动的进程放到这里,ipfail是用来检测网络连通性的工具,hacluster为启动该程序的用户
debugfile /var/log/ha-debug.log
#####以上为添加内容
把node1上的三个配置文件拷贝至node2
node1上执行:
cd /etc/ha.d;
scp ha.cf haresources authkeys node2:/etc/ha.d/
node2上修改 vim /etc/ha.d/ha.cf //把
ucast eth1 192.168.200.129改为 ucast eth1 192.168.200.128
启动heartbeat: node1 & node2都执行:
service heartbeat start
4. 测试heartbeat
node1 上把icmp禁止:
iptables -I INPUT -p icmp -j DROP
tail -f /var/log/ha-log.log
使用命令:ifconfig 查看,已经没有了 eth0:0
node2 上ifconfig查看, 已经开启了eth0:0
在node1上解除防火墙:
iptables -D INPUT -p icmp -j DROP
tail -f /var/log/ha-log.log
ifconfig命令查看eth0:0 会开启,而node2上eth0:0会自动关闭
在node1上执行命令:killall heartbeat
node2上也会自动开启eth0:0