高可用集群（HA）配置

高可用集群（HA）

1. 准备工作

HA的心跳监测可以通过串口连接监测也可以通过网线监测，前者需要服务器有一个串口，后者需要有一个空闲网卡。
HA架构中需要有一个共享的存储设备
首先需要在两台机器上安装mysql服务，并架设好共享存储资源(NFS), 共享的目录应该是datadir
HA需要两台机器配置一个相同的vip
理论上每台机器要配置三个ip，一个是vip(eth0:0)，一个是心跳线监测使用的ip(eth1)，还有一个是服务使用的ip(eth0)

我们设定如下环境：
vip(eth0:0): 192.168.0.100
机器1 eth0:192.168.0.21 eth1: 192.168.200.128
机器2 eth0:192.168.0.22 eth1: 192.168.200.129
机器1 我们简称node1, 机器2我们简称node2

配置hosts, 两台机器一样:
192.168.0.21 node1
192.168.0.22 node2

node1 & node2 关闭防火墙，关闭selinux

配置hostname
虽然我们口头上约定好了node1 node2，但是若是主机名和这个不一致，会导致heartbeat启动不了。所以还得在每台机器上配置hostname。

2. 配置NFS安装mysql

NFS由第三台机器(192.168.0.11)提供
NFS 服务端执行：vim /etc/exports //内容如下
/data/share 192.168.0.0/24(rw,sync,no_root_squash)
NFS服务端执行命令:
/etc/init.d/rpcbind start; /etc/init.d/nfs start

node1 & node2 执行以下步骤：
mkdir -p /data/mysql
mount -t nfs 192.168.0.11:/data/share/ /data/mysql/
groupadd -g 27 mysql
useradd -u 27 -g mysql mysql
chown -R mysql:mysql /data/mysql

下载免编译的二进制mysql包
wget http://syslab.comsenz.com/downlo ... -icc-glibc23.tar.gz
tar zxvf mysql-5.1.40-linux-i686-icc-glibc23.tar.gz
mv mysql-5.1.40-linux-i686-icc-glibc23 /usr/local/mysqlcd /usr/local/mysql
cp support-files/my-large.cnf /etc/my.cnf
cp support-files/mysql.server /etc/init.d/mysqld
vim /etc/init.d/mysqld //更改datadir 以及 basedir
以下操作仅在node1上执行，node2 上不用执行这一步：
./scripts/mysql_install_db --user=mysql --datadir=/data/mysql
node1 上先启动mysql，node2上暂时先不启动：
/etc/init.d/mysqld start
注意：如果想启动node2上的mysql，必须先停掉node1上的mysql，因为这两个mysql共同用一个datadir有共享的资源，会产生冲突，而在heartbeat服务中，如果node1正常则node2默认就停止mysql服务，只有当node1宕机，node2才会自动启动mysql服务

3. 安装配置heartbeat

node1 & node2 执行:

需先安装epel扩展源：
yum install -y epel-release
yum install -y heartbeat* libnet

以下配置在node1:
cd /usr/share/doc/heartbeat-2.1.3/
cp authkeys haresources ha.cf /etc/ha.d/
cd /etc/ha.d

vim authkeys// 增加下面两行：
auth 3
3 md5 Hello!
###
保存后更改它的权限：
chmod 600 authkeys

vim haresources //增加一行:
node1 192.168.0.100/24/eth0:0 mysqld

注意：此处的启动脚本不能是软链接！！！

vim ha.cf //更改或增加如下内容
logfile /var/log/ha.log
#bcast eth1   #心跳使用以太网广播方式，eth1为广播地址
ucast eth1 192.168.200.129 #单播形式与对方机器通信，与上者二选一
keepalive 2   #每2秒发一次广播
warntime 10   # 这个时间为警告时间，10s钟内没有收到对方节点的信号，则会发警告信息记录到日志里
deadtime 30  #30s内没有收到对方节点的信号则认为对方节点宕机，然后立即接管对方节点的服务
initdead 120   #这个时间是给重启系统留出来的等待时间，如果系统重启了那么网络服务不会立即正常使用
udpport 694   # 广播通信使用的端口
auto_failback on   # 如果是on, 则当主节点故障恢复后，服务还会切换回来
node node1   #主节点主机名
node node2   #从节点主机名
ping 192.168.0.1   #仲裁节点，最好是一个比较强健的设备，比如说交换机
respawn hacluster /usr/lib/heartbeat/ipfail
   #当heartbeat启动时也会随着一起启动的进程放到这里，ipfail是用来检测网络连通性的工具，hacluster为启动该程序的用户
debugfile /var/log/ha-debug.log
#####以上为添加内容

把node1上的三个配置文件拷贝至node2
node1上执行：
cd /etc/ha.d;
scp ha.cf haresources authkeys node2:/etc/ha.d/

node2上修改 vim /etc/ha.d/ha.cf //把
ucast eth1 192.168.200.129改为 ucast eth1 192.168.200.128

启动heartbeat： node1 & node2都执行：
service heartbeat start

4. 测试heartbeat
node1 上把icmp禁止：
iptables -I INPUT -p icmp -j DROP
tail -f /var/log/ha-log.log
使用命令：ifconfig 查看，已经没有了 eth0:0
node2 上ifconfig查看，已经开启了eth0:0
在node1上解除防火墙：
iptables -D INPUT -p icmp -j DROP
tail -f /var/log/ha-log.log
ifconfig命令查看eth0:0 会开启，而node2上eth0:0会自动关闭
在node1上执行命令：killall heartbeat
node2上也会自动开启eth0:0

秒客网

高可用集群（HA）配置

相关文章