mysql 架构篇系列 3 复制运行状态监控与选项参数说明

时间:2020-12-14 16:20:38

一. 概述

  在上一篇中,搭建了一主一从的复制架构,这篇通过一些诊断方法来了解复制的运行状态和一些选项参数说明。上次mysql主从服务关机,今天在打开mysql服务,出现了错误信息。

  1.首先 启动主从mysql服务

  2.在从库上执行START SLAVE, 开始复制。

  3.在从库上执行SHOW PROCESSLIST;  slave已经连接上master, 并开始接受并执行日志。

mysql 架构篇系列 3 复制运行状态监控与选项参数说明
  4.在从库上执行SHOW  SLAVE STATUS,查看复制状态

    错误信息: Got fatal error 1236 from master when reading data from binary log: 'Could not find first log file name in binary log index file'

  5. 解决方法 

-- 在主库上执行,记录日志文件号和位置,如下图所示:
flush logs;
show master status;

mysql 架构篇系列 3 复制运行状态监控与选项参数说明

  -- 在从库上执行
CHANGE MASTER TO MASTER_LOG_FILE='mysql-bin.000072',MASTER_LOG_POS=154; SLAVE START;

    从库上再执行SHOW PROCESSLIST,显示了二个复制进程:一个是 I/O线程,连接master,id为7。 一个是SQL线程,id为8。如下图所示:

mysql 架构篇系列 3 复制运行状态监控与选项参数说明

.复制中的各类文件

  myql复制中涉及了两类非常重要的日志文件:二进制日志文件(binlog), 中继日志文件(relay log)。 binlog文件会把mysql中所有数据修改操作以二进制形式记录,包括create,drop,insert,update,delete操作等,但不记录查询select操作。对于二进制binlog文件格式,三种支持类型包括:Statement,Row,Mixed ( 在mysql 架构篇第一篇中有讲到)。

  2.1 从库relay log 中继日志文件

    从库中继日志文件relay log的文件格式,内容和主库二进制日志文件binlog一样,唯一的区别在于从库上的sql线程在执行完当前中继日志文件relay log中的事件之后,sql 线程会自动删除当前中继日志文件realy log,避免从库上的中继日志文件relay log占用过多的磁盘空间。

  2.2 从库 master.info和realy-log.info文件

    为了保证从库crash重启后,从库的I/O线程仍然能够知道从哪里开始复制,从库上默认还会创建二个日志文件master.info 和realy-log.info 用来保存复制的进度。 这两个文件在磁盘上以文件形式记录,位置在data目录下。I/O线程维护master.info 中主库二进制日志binlog的进度。sql线程维护realy-log.info 应用中继日志relay log 的进度。 总结是: I/O线程关联master.info,sql线程关联realy-log.info。再来看下复制原理图:

mysql 架构篇系列 3 复制运行状态监控与选项参数说明

  2.3 复制状态信息

    在从库上通过SHOW SLAVE STATUS,能了解复制的状态, 里面的信息包含了master.info和realy-log.info的信息。

    (1) master.info对应的信息如下:

Master_Host

172.168.18.201

主库IP

Master_User

rep1

主库上用于复制的账号

Master_Port

3306

主库mysql 端口

Master_Log_File

mysql-bin.000072

从库I/O线程当前读取主库binlog的文件名

Read_Master_Log_Pos

514

从库I/O线程读取主库binlog的位置

    (2) realy-log.info对应的信息如下:

Relay_Log_File

xuegod64-relay-bin.000005

SQL线程正在应用的relay log

Relay_Log_Pos

680

SQL线程正在应用的relay log的位置

Relay_Master_Log_File

mysql-bin.000072

SQL线程正在应用的relay log对应的binlog

Exec_Master_Log_Pos

514

SQL线程正在应用的relay log的位置对应的主库binlog的位置

    (3) 其它信息

Connect_Retry

60

连接中断后,重新尝试连接的时间间隔。默认值是60秒

Slave_IO_Running

Yes

I/O线程是否被启动并成功地连接到主服务器上

Slave_SQL_Running

Yes

SQL线程是否被启动

Replicate_Do_DB

Replicate_Ignore_DB

Replicate_Do_Table

Replicate_Ignore_Table

Replicate_Wild_Do_Table

Replicate_Wild_Ignore_Table

指明哪些库或表在复制的时候不要同步到从库

Last_Error

0

SQL线程读取日志参数的的错误数量和错误消息

Skip_Counter

0

设置跳过sql执行步数

Relay_Log_Space

890

原有的中继日志结合起来的总大小

Master_SSL_Allowed

No

1) 如果允许对主服务器进行SSL连接,则值为Yes

2) 如果不允许对主服务器进行SSL连接,则值为No

3) 如果允许SSL连接,但是从属服务器没有让SSL支持被启用,则值为Ignored。

SQL_Delay

0

一个非负整数,表示秒数,Slave滞后多少秒于master

Master_Retry_Count

86400

连接主库失败最多的重试次数

  2.4  主库 binlog 格式

-- 查看当前binlog格式
SHOW VARIABLES LIKE '%binlog_format%'

mysql 架构篇系列 3 复制运行状态监控与选项参数说明

-- 全部更新
UPDATE testbackup SET `name`=CONCAT(`name`,'hello')
--通过mysqlbinlog检查,可以发现记录是按row 每行记录的。
[root@hsr ~]# mysqlbinlog --base64-output=decode-row -v /var/lib/mysql/mysql-bin.000072
#181029 14:33:20 server id 1  end_log_pos 1539 CRC32 0xde0ceeff     Update_rows: table id 221 flags: STMT_END_F
### UPDATE `test`.`testbackup`
### WHERE
### @1=1
### @2='张三2'
### SET
### @1=1
### @2='张三2hello'
### UPDATE `test`.`testbackup`
### WHERE
### @1=2
### @2='李四'
### SET
### @1=2
### @2='李四hello'
### UPDATE `test`.`testbackup`
### WHERE
### @1=3
### @2='五五'
### SET
### @1=3
### @2='五五hello'
### UPDATE `test`.`testbackup`
### WHERE
### @1=4
### @2='赵六'
### SET
### @1=4
### @2='赵六hello'
### UPDATE `test`.`testbackup`
### WHERE
### @1=5
### @2='小红'
### SET
### @1=5
### @2='小红hello'
### UPDATE `test`.`testbackup`
### WHERE
### @1=6
### @2='小明'
### SET
### @1=6
### @2='小明hello'
### UPDATE `test`.`testbackup`
### WHERE
### @1=7
### @2='田七'
### SET
### @1=7
### @2='田七hello'
### UPDATE `test`.`testbackup`
### WHERE
### @1=8
### @2='小康'
### SET
### @1=8
### @2='小康hello'
### UPDATE `test`.`testbackup`
### WHERE
### @1=9
### @2='小王'
### SET
### @1=9
### @2='小王hello'
### UPDATE `test`.`testbackup`
### WHERE
### @1=10
### @2='小李'
### SET
### @1=10
### @2='小李hello'
### UPDATE `test`.`testbackup`
### WHERE
### @1=11
### @2='小王'
### SET
### @1=11
### @2='小王hello'
### UPDATE `test`.`testbackup`
### WHERE
### @1=12
### @2='小李子1'
### SET
### @1=12
### @2='小李子1hello'
-- 现在将binlog格式从row 改为 statement 格式
-- 当前会话
SET binlog_format='statement'
-- 全部更新
UPDATE testbackup SET `name`=CONCAT(`name`,'hello123')

  再通过mysqlbinlog检查,可以发现记录是按statement语句级记录的。

BEGIN
/*!*/;
# at 1714
#181029 14:41:21 server id 1 end_log_pos 1860 CRC32 0x9fdf71e9 Query thread_id=2 exec_time=0 error_code=0
use `test`/*!*/;
SET TIMESTAMP=1540795281/*!*/;
-- 全部更新
update testbackup set `name`=concat(`name`,'hello123')
/*!*/;
# at 1860
#181029 14:41:21 server id 1 end_log_pos 1891 CRC32 0x4b7199d3 Xid = 579
COMMIT/*!*/;

  总结:在binlog_format格式为row时,mysql实际上在binlog是一行行记录数据的变更。当格式为statement时是按语句级记录。 row格式比statement格式更能保证从库数据的一致性(复制是记录,而不是单纯操作sql),但row格式下的binlog的日志量很可能会增大好几倍,在设置时需要考虑磁盘空间问题。

三. 刷新磁盘频率

  对于支持事务引擎(如innodb)来说, 每个事务提交时都需要写binlog,对于不支持事务的引擎(例myisam)来说,每个sql语句执行完成时,都需要写binlog。 为了保证binlog安全,mysql引入了 sync_binlog 参数来控制binlog刷新到磁盘的频率。

  关于sync_binlog在: mysql 开发进阶篇系列 19 MySQL Server(innodb_flush_log_at_trx_commit与sync_binlog)中有介绍。

-- 查看binlog格式
SHOW VARIABLES LIKE '%sync_binlog%'

mysql 架构篇系列 3 复制运行状态监控与选项参数说明

  当sync_binlog=1时,是最安全的,当主机突然断点,系统最多损失最近的一条事务的数据。但是在多个事务并发提交时,mysql不得不按顺序处理请求,同时高频率的刷新binlog对I/O影响明显,很大程度影响了mysql的性能。

  所以一般线上系统mysql的sync_binlog不会设置为1, 而是2或0,在数据安全性和更高的并发之间获取一个平衡。