Percona XtraBackup 实现全备&增量备份与恢复【转】

时间:2022-01-30 04:41:27

percona-xtrabackup主要是有两个工具,其中一个是xtrabackup,一个是innobackupex,后者是前者封装后的一个脚本。
在针对MySQL的物理备份工具中,大概是最流行也是最强大的工具了,此外著名的物理备份工具还有官方的mysqlbackup。
xtrabackup只可备份事务表,不能用于备份非事务表,而innobackupex不仅可用于备份事务表,也可以备份非事务表如MyISAM
此文主要介绍innobakcupex的使用和原理。

本文所用到的版本:
xtrabackup 2.3.7 + MySQL 5.6.30

若MySQL版本为5.7.x,建议使用xtrabackup 2.4.x


〇 xtrabackup可以做的
    对InnoDB引擎的表做热备
    增量备份
    流压缩传输到另外的服务器上
    在线移动表
    更简单的创建从库
    备份时不增加服务器负载

 〇 原理
     备份及恢复大致涉及三个步骤:备份 -> prepare -> 恢复
     备份运行时,工具会记住当时的LSN号,并打开xtrabackup_logfile,然后开始对datafile进行copy,即ibdata1及ibd文件。
     复制需要一定的时间,在复制期间,如果文件被修改,工具将监视redo log file并将每一次更变记录下来,保存在xtrabackup_logfile中。
     接下来处理非事务表如MyISAM的备份操作,innobackupex通过FLUSH TABLES WITH READ LOCK来阻塞DML。
     并在此时获取binlog的position[和GTID](此处我理解为和mysqldump --single-transaction处理方式类似)
     在做完非事务表的copy之后,执行UNLOCK TABLES,完成备份,并停止记录xtrabackup_logfile。
     接下来就是需要做prepare的过程,该过程类似InnoDB的crash-recovery。
     对redo log进行前滚(到数据文件),并将没提交的事务进行回滚操作(rollback),这样便可以保证数据的一致性,所以对于事务表,整个过程是不会影响写操作的。
 
     注:InnoDB、XtraDB、MyISAM是肯定支持的,其他的存储引擎不确定,待测。
 
 〇 权限需求
     操作系统:
         对datadir需要有rwx的权限。
     MySQL:
         最小所需要的权限有:
         RELOAD
         LOCK TABLES(如果加上--no-lock的话可以不要)
         REPLICATION CLIENT(为了获得binary log的position)
         PROCESS(为了执行show engine innodb status,并且需要查看所有运行的线程)
         其他可能需要用到的权限:
         CREATE TABLESPACE(如果需要通过5.6+ 的TTS恢复/迁移单个表的话)
         SUPER(可能需要在复制环境里启动或者停止slave线程)
         CREATE\INSERT\SELECT(对PERCONA_SCHEMA.xtrabackup_history进行操作)
 
 〇 安装
     安装超简单(只能在linux上用,不过但这就够了)
     https://www.percona.com/downloads/XtraBackup/LATEST/
     戳进去选择版本down下来很容易就可以用了。
     有RPM包、DEB包、源码包、二进制包。
     个人推荐使用二进制包,解压,配置环境变量即可使用,在debian系或RHEL系通用,方便的一比。
     源码包的安装,可以参考我这篇博文:
     http://blog.itpub.net/29773961/viewspace-1853405/
 
 〇 配置
     默认读取my.cnf的选项,读取优先级与MySQL相同。
     比如在备份和恢复的时候无需指定datadir等,因为可以读取[mysqld]组下的选项。
     同样也可以读取[client]的信息,比如可以将socket,user,password加载到(虽然因为安全因素不建议使用,但是可以这么做)。
     当然也可以通过innobackupex --defaults-file=xxxx/my.cnf 去指定将要读取的配置文件。
 
 〇 全备
 ① 备份:
     若加上--no-timestamp,则不会在所指定的目录里生成一个时间戳目录,而是直接放在所指定的目录里,我一般是加的:
     innobackupex --user= --password= $basedir [--no-timestamp](当然--user/--password可以直接写作 -u $username -p $password)
     
     在备份的文件夹中,有几个文件值得注意:
     xtrabackup_binlog_info记录了binlog的position,若开启了GTID,也会将GTID取出。
     在用于备份+binlog恢复或建立slave的场景里十分有用。
     xtrabackup_checkpoints记录了此次备份的类型和lsn号的起始值,是否压缩等
     xtrabackup_info则记录了备份工具的信息,时间,备份对象(是针对全实例还是某库表),是否是增量,binlog位置等
 
     # cat xtrabackup_binlog_info
     binlog.000001   2321    931d11a2-9a8b-11e6-829f-000c298e914c:1-8
  
     # cat xtrabackup_checkpoints
     backup_type = full-backuped
     from_lsn = 0
     to_lsn = 304247338
     last_lsn = 304247338
     compact = 0
      recover_binlog_info = 0
  
     # cat xtrabackup_info
     uuid = cfb49b5f-02e8-11e7-94b4-000c298e914c
     name = 
     tool_name = innobackupex
     tool_command = --password=... /data/dbbak
     tool_version = 2.3.7
     ibbackup_version = 2.3.7
     server_version = 5.6.30-log
     start_time = 2017-03-07 11:47:36
     end_time = 2017-03-07 11:47:39
     lock_time = 0
     binlog_pos = filename 'binlog.000001', position '2321', GTID of the last change '931d11a2-9a8b-11e6-829f-000c298e914c:1-8'
     innodb_from_lsn = 0
     innodb_to_lsn = 304247338
     partial = N
     incremental = N
     format = file
     compact = N
     compressed = N
     encrypted = N 
 

     还有一个backup-my.cnf文件,则记录了备份时可能涉及到的选项参数,比如系统表空间信息,独立undo表空间信息,redo-log信息等:
     # cat backup-my.cnf 
     # This MySQL options file was generated by innobackupex.
  
     # The MySQL server
     [mysqld]
     innodb_checksum_algorithm=innodb
     innodb_log_checksum_algorithm=innodb
     innodb_data_file_path=ibdata1:12M:autoextend
     innodb_log_files_in_group=2
     innodb_log_file_size=50331648
     innodb_fast_checksum=false
     innodb_page_size=16384
     innodb_log_block_size=512
     innodb_undo_directory=.
     innodb_undo_tablespaces=0 
 
 ② prepare:
     第二步就是prepare,前文也提到,这个过程类似innodb的crash recovery
     也可以理解为是“apply”的过程,这里是全备prepare的命令,十分简单
     innobackupex --apply-log $basedir
     在--apply-log的时候,可以指定--use-memory,增大其值加快速度,若不指定,默认值为100MB。
 
 ③ 恢复到datadir:
     恢复过程也十分简单(全备和增备都是这一个恢复命令),只需要加上--copy-back参数即可
     innobackupex --copy-back $basedir
     这样就可以将$basedir的东西恢复到datadir下了,datadir无需指定,将会读取my.cnf获得
     默认是需要datadir内为空的(或者没有创建),如果要强制写,则需要加参数: --force-non-empty-directories
 
 
 〇 增备
     
     增量备份比起全备要复杂一点,本文也想主要介绍如何做增量备份。
     用于有的场景,可能不需要每天对数据做全备。
     比如有的场景是,每周做一次全备,每天对做一次增量备份,可以节约磁盘空间也可以减少备份时间。
     增备的原理是通过对比LSN的信息,来找到被更变的数据,当有了修改操作时,LSN号会改变,和上一次全备的差异LSN号做对比,则可将差异数据备份出来。
 
     整个过程还是分为三个步骤,备份 -> prepare -> 恢复
 
 ①增备方法与全备不一样:
     innobackupex --user= --password= --incremental $new_dir --incremental-basedir=$basedir
 
    其中--incremental是本次增量备份存放目录
     $new_dir是表示将增量备份出来的东西放在哪个目录
     --incremental-basedir则表示,针对哪一次备份做增量备份
 
     备份的差异在目录的xtrabackup_checkpoints中查看:
     比如:
     $basedir中内容: 
     backup_type = full-prepared
     from_lsn = 0
     to_lsn = 304247338
     last_lsn = 304247338
     compact = 0
     recover_binlog_info = 0 
 
     $new_bkdir中内容:
     backup_type = incremental
     from_lsn = 304247338
     to_lsn = 304250267
     last_lsn = 304250267
     compact = 0
     recover_binlog_info = 0
  
     可以注意一下增备的from_lsn号
     大于这个LSN号的页都是被变更过的,这些偏移量,也就是需要被增量备份出去的
 
 ②prepare:
     prepare过程:
     从第一个备份开始(也就是全量)做prepare,再将往后的增量备份依次添加到全量备份中。
     注意,此处多了一个参数即--redo-only,该参数是指将已提交的事务应用,未提交的事务回滚。
     此外,--incremental-dir也是在之前没有用到过的,这个参数代表需要被合并进去的增量备份目录。
     注意,此处多次的增量备份是指:针对上次的增量备份做的增量。
    
     也就是可以理解为:
         全备:500GB
         第一次增量备份:2GB
         第二次增量备份:1GB(针对第一次增量备份的增量数据)
         ……
         第n次
 
     按照备份顺序做prepare,也就是prepare的顺序为:
     第一次全备 -> 增量备份1 -> 增量备份2 -> ... -> 增量备份n
     第一次全备的prepare:innobackup --apply-log --redo-only $basedir
     第二次prepare:innobackup --apply-log --redo-only $basedir --incremental-dir=$new_dir_1(此处的$new_dir_1也就是第一次增量备份)
     ......
     第n次prepare:innobackup --apply-log $basedir --incremental-dir=$new_dir_n(此处的$new_dir_n也就是最近也就是最后一次的增量备份
     最后一次增量备份的prepare,不需要指定--redo-only
 
     最后将增量备份和全备进行合并,将未提交的事务回滚,这个操作和全量prepare无异:
     innobackup --apply-log $basedir
 
     看起来有点复杂,但没关系,下面会有实验和图解。
 
 ③恢复到datadir:
     和全量无异,直接copyback就行了
     innobackupex --copy-back $basedir
 
  增量备份的prepare有点蛋疼,还是小结一下:
      ① prepare完备(加上--redo-only)
      ② prepare每一次增量备份到完备中,需要加上--redo-only,最后一次增量备份的prepare不需要加--redo-only
      ③ 对生成的最终完备做--apply-log
 
  


 〇 实验
 
     接下来就是实验……
     先建个备份用的用户,给个权限。

mysql> CREATE USER xbackup@localhost IDENTIFIED BY 'back123';
mysql> GRANT RELOAD, PROCESS, LOCK TABLES, REPLICATION CLIENT ON *.* TO xbackup@localhost;

   
 〇 完全备份&恢复
     在test.tb里加入测试数据

mysql> CREATE TABLE test.tb(id int primary key, name varchar());
Query OK, rows affected (0.07 sec) mysql> INSERT INTO test.tb VALUES(,'zhou'),(,''),(,'YYF'),(,'ChuaN'),(,'Faith');
Query OK, rows affected (0.02 sec)
Records: Duplicates: Warnings:

    创建备份存放目录
     $ mkdir -p /data/backup/   
 
    指定备份存放位置,开始备份
     $ innobackupex -uxbackup -pbackup123 --no-timestamp /data/backup/backup
     此处的/data/backup/backup就是全备的目录了。

    …………(省略刷屏输出)
     xtrabackup: Transaction log of lsn (304289583) to (304290858) was copied.
     170321 16:06:11 completed OK!
 
     看到completed OK,表明就真的ok了。
 
     可以看一下这个目录中的内容:
     一部分是MySQL下datadir的内容,如库目录,redolog,系统表空间。
     一部分是之前也有介绍过的,由备份工具生成的东西:
      backup-my.cnf
      ibdata1
      ib_logfile0    
      ib_logfile1
      mysql
      performance_schema
      test
      xtrabackup_binlog_info
      xtrabackup_binlog_pos_innodb
      xtrabackup_checkpoints
      xtrabackup_info
      xtrabackup_logfile
 
 
     进行prepare
 
    $ innobackupex --apply-log /data/backup/backup
 
     关闭mysqld
     $ mysqladmin -uroot -p shutdown
     Enter password: 
     $ ps -ef|grep mysql
     root       2991   2438  1 11:08 pts/0    00:00:00 grep mysql
 
     移除datadir:
     $ mv /data/mysql_data /data/mysql_data.bk
 
     恢复数据
     $ innobackupex --copy-back /data/backup/backup/
 
     修改新datadir的权限
     $ chown mysql:mysql -R /data/mysql_data
 
     启动数据库
     $ mysqld &
     $ ps -ef|grep mysql
     root       2712   2438 86 16:35 pts/0    00:00:02 mysqld
     root       2714   2438  0 16:35 pts/0    00:00:00 grep mysql
 

    检查test.tb中的内容 

$ mysql -e "SELECT * FROM test.tb;"
+----+-------+
| id | name |
+----+-------+
| | zhou |
| | |
| | YYF |
| | ChuaN |
| | Faith |
+----+-------+

     至此,完全备份&恢复完成
 

 〇 增量备份&恢复
 
    先来一次全备:
     $ innobackupex -uxbackup -pbackup123 --no-timestamp /data/backup/all_backup
     修改测试表及数据:(加个字段,改两条数据)

mysql> ALTER TABLE test.tb ADD COLUMN picked varchar();
Query OK, rows affected (0.06 sec)
Records: Duplicates: Warnings:
mysql> UPDATE test.tb SET picked='naga' WHERE id=;
Query OK, row affected (0.04 sec)
Rows matched: Changed: Warnings: mysql> UPDATE test.tb SET picked='TA' WHERE id=;
Query OK, row affected (0.00 sec)
Rows matched: Changed: Warnings:

 
     执行第一次增量备份:
     $ innobackupex -uxbackup -pbackup123 --no-timestamp --incremental /data/backup/incremental-dir-1 --incremental-basedir=/data/backup/all_backup/ 
 
 
    可以再做一次增量备份:
     此时有两种增量备份方法:
     第一种,总是针对basedir做增量,这个方式恢复起来就特别简单了,只需要将最后一次的增量备份合并到全量备份里,就可以恢复了。
     第二种,总是针对上一次的增量,做增量备份。这个方式的恢复,就要逐一合并了,也就是我上述所说看起来有点复杂的增备思路。
     反正我是喜欢第一种的,感觉也可以适应绝大多数场景。
 
      我拿word涂了两张图,帮助理解。
     第一种:
     总是将1月1日的全备作为basedir,所以FROM_LSN号总是5000。
     Percona XtraBackup 实现全备&增量备份与恢复【转】
 
     第二种:
     总是把上一次(最近一次)的备份作为basedir。
     
 Percona XtraBackup 实现全备&增量备份与恢复【转】

 
    此处介绍第二种:
    多次增量备份的方法依旧,只需要修改--incremental-basedir即可:
     
     继续对test.tb做一些修改: 

mysql> UPDATE test.tb SET picked='DS' WHERE id=;
Query OK, row affected (0.04 sec)
Rows matched: Changed: Warnings:
mysql> SELECT * FROM test.tb;
+----+-------+--------+
| id | name | picked |
+----+-------+--------+
| | zhou | naga |
| | | TA |
| | YYF | DS |
| | ChuaN | NULL |
| | Faith | NULL |
+----+-------+--------+
rows in set (0.01 sec)

     针对第一次增量备份/data/backup/incremental-dir-1,做第二次增量备份,将第二次的增量备份放到/data/backup/incremental-dir-2/
 
    $ innobackupex -uxbackup -pbackup123 --no-timestamp --incremental /data/backup/incremental-dir-2/ --incremental-basedir=/data/backup/incremental-dir-1
 

    prepare过程,这个也是增量备份里最蛋疼的过程:
     
     因为总共做了三次备份,所以先做三次prepare:
     先对全备做prepare:
     $ innobackupex --apply-log --redo-only /data/backup/all_backup/
     然后接下来做第一次增量备份的prepare:
     $ innobackupex --apply-log --redo-only /data/backup/all_backup/ --incremental-dir=/data/backup/incremental-dir-1
     再对第二次的增量备份prepare,注意,第二次的增备是最后一次,所以不需要加上--redo-only参数:
     $ innobackupex --apply-log /data/backup/all_backup/ --incremental-dir=/data/backup/incremental-dir-2
     
     最后将两次增量备份和全备做一次合并:
     $ innobackupex --apply-log /data/backup/all_backup/
 
     恢复过程,这个和全量恢复没有区别:
 
    停掉mysqld
     $ mysqladmin -uroot -p shutdown
     $ ps -ef|grep mysql
     root       3533   3081  0 17:05 pts/1    00:00:00 grep mysql
     
     移除datadir
     $ mv /data/mysql_data /data/mysql_data.bk2
     
     恢复数据
     $ innobackupex --copy-back /data/backup/all_backup/
     
      修改新datadir的权限
     $ chown mysql:mysql -R /data/mysql_data
 
      启动
     $ mysqld &
 
    检查一下,全备和两次增备的内容都已经被恢复回来了,也就是最后一次数据的状态: 

$ mysql -uroot -p -e "SELECT * FROM test.tb;"
+----+-------+--------+
| id | name | picked |
+----+-------+--------+
| | zhou | naga |
| | | TA |
| | YYF | DS |
| | ChuaN | NULL |
| | Faith | NULL |
+----+-------+--------+

      至此,增量备份&恢复完成。
 
 


 〇 总结一下xtrabackup备份及恢复全过程:
 
      1、备份操作,需要提供具有足够权限的MySQL用户,并且mysqld启动用户需要对datadir有rwx的权限。
      2、prepare,将未提交的事务回滚,将已提交的事务写入数据文件。
      3、停止mysqld服务
      4、mv data/ data_bak_.../
      5、copyback回去
      6、修改权限新的datadir权限
      7、启动服务
 
     当然,上述所有的备份对象,都是针对整个MySQL实例。

 
 


 〇 参考资料:
 
 官方手册:
 https://www.percona.com/doc/percona-xtrabackup/2.3/index.html
 云栖社区@白及88用户:
 https://yq.aliyun.com/articles/45746
 

本文转自

Percona XtraBackup 实现全备&增量备份与恢复-神谕丶-ITPUB博客
http://blog.itpubhttp.itpub.net/29773961/viewspace-2135920/