采用Heartbeat+DRBD+mysql高可用方案,配置两个节点的高可用集群
l 配置各节点互相解析
gb07
gb06
l 配置各节点时间同步
gb07
[root@gb07 ~]# ntpdate 10.10.102.7
gb06
[root@gb06 ~]# ntpdate 10.10.102.7
l 各节点关闭SELinux
修改/etc/selinux/config文件中设置SELINUX=disabled ,然后重启服务器。
l Corosync 安装与配置(两节点上都要安装配置)
- 安装Corosync
gb07
[root@gb07 ~]# yum install -y corosync
gb06
[root@gb06 ~]# yum install -y corosync
- .配置Corosync
[root@gb07 ~]# cd /etc/corosync/
[root@gb07 corosync]# mv corosync.conf.example corosync.conf
[root@gb07 corosync]# vim corosync.conf
compatibility: whitetank
totem { #心跳信息传递层
version: 2 #版本
secauth: on #认证信息 一般on
threads: 0 #线程
interface { #定义心跳信息传递的接口
ringnumber: 0
bindnetaddr: 10.10.0.0 #绑定的网络地址,写网络地址
mcastaddr: 226.94.1.1 #多播地址
mcastport: 5405 #多播的端口
ttl: 1 #生存周期
}
}
logging { #日志
fileline: off
to_stderr: no #是否输出在屏幕上
to_logfile: yes #定义自己的日志
to_syslog: no #是否由syslog记录日志
logfile: /var/log/cluster/corosync.log #日志文件的存放路径
debug: off
timestamp: on #时间戳是否关闭
logger_subsys {
subsys: AMF
debug: off
}
}
amf {
mode: disabled
}
service {
ver: 0
name: pacemaker #pacemaker作为corosync的插件进行工作
}
aisexec {
user: root
group: root
}
[root@gb07 corosync]# scp corosync.conf gb06:/etc/corosync/
- 认证文件
[root@gb07 corosync]# corosync-keygen
Corosync Cluster Engine Authentication key generator.
Gathering 1024 bits for key from /dev/random.
Press keys on your keyboard to generate entropy (bits = 152).
#遇到这个情况,表示电脑的随机数不够,可以不停的随便敲键盘生成随机数
[root@gb07 corosync]# scp authkey gb06:/etc/corosync/
#把认证文件也复制到gb06主机上
l Pacemaker配置与安装(两节点上都要安装配置)
- 安装pacemaker
gb07
[root@gb07 ~]# yum install -y pacemaker
gb06
[root@gb06 ~]# yum install -y pacemaker
- 安装crmsh
gb07
[root@gb07 ~]# yum –y install crm
gb06
[root@gb06 ~]# yum –y install crm
安装完成后,启动corosync service corosync start; 启动pacemaker
service pacemaker start
l DRBD 安装与配置(两个节点上都要安装配置)
- 安装drbd
gb07
[root@gb07 ~]# yum -y install drbd84 kmod-drbd84
gb06
[root@gb06 ~]# yum -y install drbd84 kmod-drbd84
如果yum源找不到包,尝试在网上搜一下drbd安装,下载相应的yum源文件再安装
- 配置drbd
[root@gb07 ~]# cat /etc/drbd.d/global_common.conf
global {
usage-count no;
# minor-count dialog-refresh disable-ip-verification
}
common {
protocol C;
handlers {
pri-on-incon-degr "/usr/lib/drbd/notify-pri-on-incon-degr.sh; /usr/lib/drbd/notify-emergency-reboot.sh; echo b > /proc/sysrq-trigger ; reboot -f";
pri-lost-after-sb "/usr/lib/drbd/notify-pri-lost-after-sb.sh; /usr/lib/drbd/notify-emergency-reboot.sh; echo b > /proc/sysrq-trigger ; reboot -f";
local-io-error "/usr/lib/drbd/notify-io-error.sh; /usr/lib/drbd/notify-emergency-shutdown.sh; echo o > /proc/sysrq-trigger ; halt -f";
# fence-peer "/usr/lib/drbd/crm-fence-peer.sh";
# split-brain "/usr/lib/drbd/notify-split-brain.sh root";
# out-of-sync "/usr/lib/drbd/notify-out-of-sync.sh root";
# before-resync-target "/usr/lib/drbd/snapshot-resync-target-lvm.sh -p 15 -- -c 16k";
# after-resync-target /usr/lib/drbd/unsnapshot-resync-target-lvm.sh;
}
startup {
#wfc-timeout 120;
#degr-wfc-timeout 120;
}
disk {
on-io-error detach;
#fencing resource-only;
}
net {
cram-hmac-alg "sha1";
shared-secret "mydrbdlab";
}
syncer {
rate 1000M;
}
}
[root@gb07 drbd.d]# cat mysql.res #资源配置文件
resource mysql {
on gb07 {
device /dev/drbd0;
disk /dev/sda3; #预留的硬盘分区
meta-disk internal;
address ipv4 10.10.102.7:7700;
}
on gb06 {
device /dev/drbd0;
disk /dev/sda3;
meta-disk internal;
address ipv4 10.10.102.6:7700;
}
}
[root@gb07 drbd.d]# scp global_common.conf mydata.res gb06:/etc/drbd.d/
- 初始化drbd的资源并启动
DRBD元数据的初始化和将元数据的初始设置写入 /dev/data/mysql,必须两个节点上都完成
创建/ dev/drbd0设备节点,将DRBD设备与本地存储设备相连,必须在两个节点上都完成
使初始设备同步,让设备成为主要的角色(可写和可读)。查看DRBD资源的主要角色和次要角色更详细的说明请参考DRBD用户指南。只能完成一个节点,就是你将继续创建文件系统的那个节点
- 格式化drbd分区(主节点上完成)
mkfs -t xfs /dev/drbd0
mount /dev/drbd0 /mysql
l 将mysql资源加入pacemaker
- 定义drbd资源
[root@jie2 ~]# crm
crm(live)# configure
crm(live)configure# property stonith-enabled=false
crm(live)configure# property no-quorum-policy=ignore
crm(live)configure# primitive mysqldrbd ocf:linbit:drbd params drbd_resource=mysql op monitor role=Master interval=10 timeout=20 op monitor role=Slave interval=20 timeout=20 op start timeout=240 op stop timeout=100
crm(live)configure#verify #检查语法
- 定义drbd的主从资源
crm(live)configure# ms ms_mysqldrbd mysqldrbd meta master-max=1 master-node-max=1 clone-max=2 clone-node-max=1 notify=true
crm(live)configure# verify
- 定义文件系统资源和约束关系
crm(live)configure# primitive mystore ocf:heartbeat:Filesystem params device="/dev/drbd0" directory="/mysql" fstype="xfs" op monitor interval=40 timeout=40 op start timeout=60 op stop timeout=60
crm(live)configure# verify
crm(live)configure# colocation mystore_with_ms_mysqldrbd inf: mystore ms_mysqldrbd:Master
crm(live)configure# order ms_mysqldrbd_before_mystore mandatory: ms_mysqldrbd:promote mystore:start
crm(live)configure# verify
- 定义vip资源、mysql服务的资源约束关系
crm(live)configure# primitive myvip ocf:heartbeat:IPaddr params ip="10.10.42.96" op monitor interval=20 timeout=20 on-fail=restart
crm(live)configure# primitive myserver lsb:mysqld op monitor interval=20 timeout=20 on-fail=restart
crm(live)configure# verify
crm(live)configure# colocation myserver_with_mystore inf: myserver mystore
crm(live)configure# order mystore_before_myserver mandatory: mystore:start myserver:start
crm(live)configure# verify
crm(live)configure# colocation myvip_with_myserver inf: myvip myserver
crm(live)configure# order myvip_before_myserver mandatory: myvip myserver
crm(live)configure# verify
crm(live)configure# commit
commit之后可以查看节点的运行状态,切换节点,看资源是否转移
- 关闭drbd的服务和关闭mysql的服务
mysql、drbd都是集群的资源,由集群管理的资源开机是一定不能够自行启动的。
[root@gb07 ~]#chkconfig mysqld off
[root@gb07 ~]#chkconfig drbd off
[root@gb06 ~]#chkconfig mysqld off
[root@gb06 ~]#chkconfig drdb off
- 为高可用Mysql配置Openstack服务
现在,OpenStack的服务必须指向MySQL配置高可用,虚拟群集IP地址 - 而不是像往常一样的MySQL服务器的物理IP地址。
对于Openstack中的glance,如果Mysql服务的ip地址是10.10.102.7,将会用到以下几行在OpenStack镜像注册配置文件中(glance-registry.conf):
sql_connection = mysql://glancedbadmin:<password>@10.10.42.96/glance
l 可能会遇到的问题
- 脑裂故障
正常状态下,查看集群中drbd资源的连接状态为:
但由于网络或机器的故障可能会出现drbd脑裂故障,集群的drbd资源连接中断:
0:mysql/0 StandAlone Secondary/Unknown UpToDate/-- C r-----
解决办法查看官方链接http://www.drbd.org/users-guide/s-resolve-split-brain.html
- 集群管理器pacemaker无法启动mysql,启动失败; 控制节点内存要足够,mysql中有个插件innodb,mysqld启动时innodb插件会初始化一个内存缓冲池,约2.3G,如果没有足够的内存,mysqld启动就会失败;
- 偶尔一个节点挂掉,修复完成后,crm resource list看到该节点的资源状态仍然是stopped,无法start,可能需要重启一下drbd和pacemaker;