mysql 主从同步异常原因及恢复:
1,auto.cnf 配置问题
这个问题是在部署主从复制的时候,可能会遇到
【1】报错
Last_IO_Error: Fatal error: The slave I/O thread stops because master and slave have equal MySQL server UUIDs; these UUIDs must be different for replication to work
【2】分析
当 mysql 做了主从时,每个 mysql 都会有个 uuid 作为唯一标识的。上面是由于主从复制的 mysql 数据库了相同的 UUID,所以只需要修改 auto.cnf 配置文件即可。
【3】解决方法
# vi /var/lib/mysql/auto.cnf
# 将文件中的 uuid 修改为不同数值
2,my.cnf 配置问题
这个问题也是在部署主从复制的时候,可能会遇到
【1】报错
Last_IO_Error: Fatal error: The slave I/O thread stops because master and slave have equal MySQL server ids; these ids must be different for replication to work (or the –replicate-same-server-id option must be used on slave but this does not always make sense; please check the manual before using it).
【2】分析
在 mysql 的主从配置中,每台 mysql 数据库的 my.cnf 中的 server-id 必须是唯一,但是有的时候可能因为粗心而配成了相同的数值,也有可能 mysql 没有加载到 my.cnf 文件中的 server-id
【3】解决方法
# vi /etc/my.cnf
修改从服务器的 my.cnf 配置文件中的 server-id (注意要改为与主服务器不同的)
在从服务器的数据库中直接添加 server_id (此 server_id 数值与 my.cnf 中的一致)
mysql> set global server_id=2;
mysql> start slave;
3,主库重启(数据库服务器宕机)
【1】报错
Last_IO_Error: Got fatal error 1236 from master when reading data from binary log: ‘binlog truncated in the middle of event; consider out of disk space on master; the first event ‘mysql-bin.001989’ at 9179, the last event read from ‘./mysql-bin.001989’ at 9179, the last byte read from ‘./mysql-bin.001989’ at 9179.’
【2】分析
由报错可看出是由于从库的二进制文件位置与主库的不一致导致的
查看主库的二进制文件的位置,重点关注 File 与 Position 列
# mysql -e 'show master status\G;'
查看从库的状态,重点关注下列两个的状态Slave_IO_Running 和 Slave_SQL_Running
# mysql -e 'show slave status\G;'
【3】解决方法
解决方法一:
忽略错误后,继续同步,(适用于主库与从库数据相差不大;要求数据可以不完全统一,数据要求不严格的情况)
在从库上停止从库同步
MariaDB [(none)]> stop slave;
从库上跳过 1 步错误(后面的数字可更改,即跳过多个错误)
MariaDB [(none)]> set global sql_slave_skip_counter=1;
在从库上开启从库
MariaDB [(none)]> start slave;
在从库上查看从库状态
MariaDB [(none)]> show slave status\G;
Slave_IO_Running: Yes
Slave_SQL_Running: Yes
解决方法二:【推荐】
重新做主从,完全同步 (适用于主库从库的数据相差较大;要求数据完全统一的情况 )
先进入主库,进行锁表,此处锁定为只读状态,防止数据写入(可选,因如有数据库备份,可直接利用备份,但也要防止备份的数据过旧)
注意:不能退出数据库,也不能用 mysql -e 命令,否则会中断这个锁!!!
MariaDB [(none)]> flush tables with read lock;
查看 master 状态:
MariaDB [(none)]> show master status;
+------------------+----------+--------------+------------------+
| File | Position | Binlog_Do_DB | Binlog_Ignore_DB |
+------------------+----------+--------------+------------------+
| mysql-bin.000021 | 52126934 | | |
+------------------+----------+--------------+------------------+
对主库进行数据备份(可选,因如有数据库备份,可直接利用备份)
注意:另开一个窗口!!!
# mysqldump -uroot -p密码 --all-databases > mysql.back.sql
进入主库,进行解锁(可选,因如有数据库备份,可直接利用备份)
MariaDB [(none)]> unlock tables;
在主库上把 mysql 的备份文件传输到从库服务器上
# scp -r mysql.back.sql root@node2:/tmp/
进入从库,停止从库的状态
MariaDB [(none)]> stop slave;
清除 slave 上的同步位置,删除所有旧的同步日志,使用新的日志重新开始.(使用前先停止 slave 服务)
MariaDB [(none)]> reset slave;
在从库中导入数据备份
MariaDB [(none)]> source /tmp/mysql.back.sql;
或
# mysql -uroot -p database -f < /tmp/mysql.bask.sql
设置从库同步
注意:master_log_file 与 master_log_pos 是主库 show master status 信息里的 File 与 Position
MariaDB [nova_cell0]> change master to master_host = '主库的 IP', master_user = '设置主从时设定的主库的用户', master_port=主库的端口, master_password='主库设定的密码', master_log_file = 'mysql-bin.000021', master_log_pos=52126934;
从库上重新开启从库同步
MariaDB [nova_cell0]> start slave;
从库上查看同步状态
MariaDB [nova_cell0]> show slave status\G;
Slave_IO_Running: Yes
Slave_SQL_Running: Yes
4,断电导致主从不能同步时,通过主库的最后一个 bin-log 日志进行恢复
在主库服务器上
# mysqlbinlog mysql-bin.xxxx > binxxxx.txt
# tail -n 100000 binxxxx.txt > tail-binxxxx.txt
打开 tail-binxxxx.txt 文件找到最后一个 postion 值
# vi tail-binxxxx.txt
然后在从库上,设置相应正确的值
mysql> slave stop;
mysql> change master to master_host='ip', master_user='username', master_password='password', master_log_file='mysql-bin.xxxx', master_log_pos=xxxx;
mysql> slave start;
mysql> show slave status\G;
5,主键冲突、表已存在等错误代码如 1062,1032,1060 等
可以在 mysql 主配置文件指定,略过此类异常并继续下条 sql 同步,这样也可以避免很多主从同步的异常中断
[mysqld]
slave-skip-errors = 1062,1032,1060