MySQL5.7 快速批量处理 slave从库 Last_Errno: 1062问题

时间:2021-08-10 18:09:34

 

 

运营同事说生成环境的Mysql连接报错处理:Can’t read dir of ’./business_db/’ (errno:13 – Permission denied)

 MySQL5.7 快速批量处理 slave从库 Last_Errno: 1062问题

 

 

上去服务器,查看到原因是,mysql运行过程中,mysql数据存放目录的权限被修改成了其它帐号mongo,所以通过远程查询报错,解决办法是重新赋予mysql帐号权限,chown  -R mysql:mysql/data/mysql,然后再重启mysql(重启过程中,如果正常restart无效,则需要kill 进程号的方式去stop 然后再start)。

 

重启mysql过后的slave报错问题,如下所示:

[root@azure_dbm1_s1 ~]# mysql -e "show slave status\G"

*************************** 1. row ***************************

               Slave_IO_State: Queueing master event to the relay log

                  Master_Host: 101.24.3.61

                  Master_User: repl

                  Master_Port: 3306

                Connect_Retry: 60

              Master_Log_File: mysql-bin.001603

          Read_Master_Log_Pos: 72081748

               Relay_Log_File: mysql-relay-bin.003111

                Relay_Log_Pos: 221898

        Relay_Master_Log_File: mysql-bin.001582

             Slave_IO_Running: Yes

            Slave_SQL_Running: No

              Replicate_Do_DB:

          Replicate_Ignore_DB:

           Replicate_Do_Table:

       Replicate_Ignore_Table:

      Replicate_Wild_Do_Table:

  Replicate_Wild_Ignore_Table:

                   Last_Errno: 1062

                   Last_Error: Could not execute Write_rows event on table business_db.MOVIE_INTERFACE_LOG; Duplicate entry '791212' for key 'PRIMARY', Error_code: 1062; handler error HA_ERR_FOUND_DUPP_KEY; the event's master log mysql-bin.001582, end_log_pos 176650062

                 Skip_Counter: 0

          Exec_Master_Log_Pos: 176641719

              Relay_Log_Space: 13274783505

              Until_Condition: None

………………

 

 

判断是因为,mysql的数据库目录/data/mysql已经被赋予了mongo用户权限,mysql无法写入,所以在slave里面没有记录。但是mysql启动是在root登录通过 service mysql start启动起来的,所以实际上数据已经通过root启动的mysql服务写进数据库了,所以在恢复slave的时候,slavesql线程依然去执行relay日志,产生了Duplicateentry的问题了。

 

不知道这个判断是否属实?

 

 

批量处理Last_SQL_Errno 1062错误

那么接下来就需要通过

stop slave; setglobal sql_slave_skip_counter=1; start slave;来跳过,但是Duplicate entry的数据太多了,手工执行不过来,需要写一个shell脚本while循环来自动跳过,脚本如下:


[root@azure_dbm1_s1 scripts]# more slave_1062_stop.sh

#/bin/bash

slave_num=`mysql -e "show slave status\G" |grep Last_SQL_Errno |awk {'print $2}'`

echo $slave_num

while [[ $slave_num = "1062" ]];

do

         mysql -e "stop slave; set global sql_slave_skip_counter=1; start slave;"

         slave_num=`mysql -e "show slave status\G" |grep Last_SQL_Errno |awk {'print $2}'`

done

[root@azure_dbm1_s1 scripts]#

 

然后执行脚本,如下:

# 开始执行脚本,等待

[root@azure_dbm1_s1 scripts]# sh slave_1062_stop.sh

1062

[root@azure_dbm1_s1 scripts]#

[root@azure_dbm1_s1 scripts]#

 

# 执行结束后,再执行下,确认Last_SQL_Errno是否正常值0

[root@azure_dbm1_s1 scripts]# sh slave_1062_stop.sh

0

[root@azure_dbm1_s1 scripts]#

 

用脚本自动化运行,比手动在命令行执行stop slave; set globalsql_slave_skip_counter=1; start slave;要方便很多。

 

 

最后用checksum检查主从数据一致性:

 

# 下载安装percona-toolkit

wget https://www.percona.com/downloads/percona-toolkit/2.2.17/deb/percona-toolkit_2.2.17-1.tar.gz

tar -xvf percona-toolkit_2.2.17-1.tar.gz

cd percona-toolkit-2.2.17/

yum install perl-DBD-MySQL -y

perl Makefile.PL

make

make test

make install

cp /usr/local/bin/pt* /bin/

 

# 开始check主从数据一致性

pt-table-checksum --nocheck-replication-filters --replicate=test.dsns --host=101.24.3.61 --port 3306 --databases=business_db -urepl -pPlcc0805@replication   --no-check-binlog-format  --no-replicate-check