alwayson故障模拟及处理方案

时间:2022-11-18 19:16:24

1.简介

数据库高可用环境的搭建可以参考以下文章

2.测试环境与总结

alwayson故障模拟及处理方案

3.检查环境与配置情况

3.1.群集正常

alwayson故障模拟及处理方案

群集IP地址在alwayson2上

alwayson故障模拟及处理方案

3.2.alwayson正常

alwayson故障模拟及处理方案

alwayson IP地址在alwayson1上

alwayson故障模拟及处理方案

3.3.群集故障转移配置

alwayson故障模拟及处理方案

3.4.alwayson故障转移配置

alwayson故障模拟及处理方案

4.模拟故障

4.1.断开alwayson ip所在的服务器网络

a1、alwayson IP中断2到3秒,alwayson IP自动飘移到成员服务器

alwayson故障模拟及处理方案

alwayson故障模拟及处理方案

a2、网络中断的时候循环脚本作业已经停止,如图可以看到网络中断这台服务器的alwayson数据库都是未同步,无法执行任何操作的。需要在飘移后的alwayson IP重新执行作业。

alwayson故障模拟及处理方案

a3、前面几次断开网络恢复接入后自动恢复正常的,由于短时间内出现3次故障现在已隔离状态,两小时后自动尝试重新加入群集。

alwayson故障模拟及处理方案

alwayson故障模拟及处理方案

a3处理方案:

a3.1、等两小时后自动清除隔离状态并加入群集恢复正常

a3.2、在powershell输入命令手动清除隔离状态加入群集恢复正常

start-clusternode -name alwayson1 -cluster wsfc -clearquarantine

alwayson故障模拟及处理方案

4.2.执行循环脚本并重启master服务器

b1、master已经飘移到alwayson2上。

alwayson故障模拟及处理方案

alwayson故障模拟及处理方案

b2、重启好后自动加入群集。

alwayson故障模拟及处理方案

群集已经恢复正常

alwayson故障模拟及处理方案

alwayson故障模拟及处理方案

数据库也已经同步好,过程全自动

alwayson故障模拟及处理方案

4.3.循环脚本执行同时重启slave服务器

循环脚本执行(5分56秒)同时并重启两台slave服务器,111.23重启5分钟完成,111.21重启8分钟左右

alwayson故障模拟及处理方案

c1、重启好后自动加入群集,数据自动同步。

alwayson故障模拟及处理方案

alwayson故障模拟及处理方案

alwayson故障模拟及处理方案

4.4.主从同时重启

alwayson故障模拟及处理方案

alwayson故障模拟及处理方案

d1、服务器重启好后全自动加入群集和数据同步

alwayson故障模拟及处理方案

alwayson故障模拟及处理方案

alwayson故障模拟及处理方案