Mysql 死锁的详细分析方法

时间:2021-08-26 08:44:15

用数据库的时候,偶尔会出现死锁,针对我们的业务系统,出现死锁的直接结果就是系统卡顿、客户找事儿,所以我们也在想尽全力的消除掉数据库的死锁。出现死锁的时候,如果只是想解锁,用show full processlist看下kill掉就好了,如果想查找到详细的问题,一个办法是用show engine innodb status来查看简略信息或者开死锁日志,后期在mysql日志里面慢慢分析。以上这写方法我们都用过,最近在看Innodb的书的时候发现另一种实时的分析方法,能最大限度的分析死锁的原因。

MySQL 5.5 版本以后,information_schema(ski:mə) 库中新增了三个关于锁的表,亦即 innodb_trx 、innodb_locks 和 innodb_lock_waits 。其中 innodb_trx 表记录当前运行的所有事务,innodb_locks 表记录当前出现的锁,innodb_lock_waits 表记录锁等待的对应关系。

下面对 innodb_trx 表的每个字段进行解释:

trx_id:事务ID。
trx_state:事务状态,有以下几种状态:RUNNING、LOCK WAIT、ROLLING BACK 和 COMMITTING。
trx_started:事务开始时间。
trx_requested_lock_id:事务当前正在等待锁的标识,可以和 INNODB_LOCKS 表 JOIN 以得到更多详细信息。
trx_wait_started:事务开始等待的时间。
trx_weight:事务的权重。
trx_mysql_thread_id:事务线程 ID,可以和 PROCESSLIST 表 JOIN。
trx_query:事务正在执行的 SQL 语句。
trx_operation_state:事务当前操作状态。
trx_tables_in_use:当前事务执行的 SQL 中使用的表的个数。
trx_tables_locked:当前执行 SQL 的行锁数量。
trx_lock_structs:事务保留的锁数量。
trx_lock_memory_bytes:事务锁住的内存大小,单位为 BYTES。
trx_rows_locked:事务锁住的记录数。包含标记为 DELETED,并且已经保存到磁盘但对事务不可见的行。
trx_rows_modified:事务更改的行数。
trx_concurrency_tickets:事务并发票数。
trx_isolation_level:当前事务的隔离级别。
trx_unique_checks:是否打开唯一性检查的标识。
trx_foreign_key_checks:是否打开外键检查的标识。
trx_last_foreign_key_error:最后一次的外键错误信息。
trx_adaptive_hash_latched:自适应散列索引是否被当前事务锁住的标识。
trx_adaptive_hash_timeout:是否立刻放弃为自适应散列索引搜索 LATCH 的标识。

下面对 innodb_locks 表的每个字段进行解释:

lock_id:锁 ID。
lock_trx_id:拥有锁的事务 ID。可以和 INNODB_TRX 表 JOIN 得到事务的详细信息。
lock_mode:锁的模式。有如下锁类型:行级锁包括:S、X、IS、IX,分别代表:共享锁、排它锁、意向共享锁、意向排它锁。表级锁包括:S_GAP、X_GAP、IS_GAP、IX_GAP 和 AUTO_INC,分别代表共享间隙锁、排它间隙锁、意向共享间隙锁、意向排它间隙锁和自动递增锁。
lock_type:锁的类型。RECORD 代表行级锁,TABLE 代表表级锁。
lock_table:被锁定的或者包含锁定记录的表的名称。
lock_index:当 LOCK_TYPE=’RECORD’ 时,表示索引的名称;否则为 NULL。
lock_space:当 LOCK_TYPE=’RECORD’ 时,表示锁定行的表空间 ID;否则为 NULL。
lock_page:当 LOCK_TYPE=’RECORD’ 时,表示锁定行的页号;否则为 NULL。
lock_rec:当 LOCK_TYPE=’RECORD’ 时,表示一堆页面中锁定行的数量,亦即被锁定的记录号;否则为 NULL。
lock_data:当 LOCK_TYPE=’RECORD’ 时,表示锁定行的主键;否则为NULL。

查看 innodb_lock_waits 表结构。

requesting_trx_id:请求事务的 ID。
requested_lock_id:事务所等待的锁定的 ID。可以和 INNODB_LOCKS 表 JOIN。
blocking_trx_id:阻塞事务的 ID。
blocking_lock_id:某一事务的锁的 ID,该事务阻塞了另一事务的运行。可以和 INNODB_LOCKS 表 JOIN。

新建一个锁事务进行模拟一下。

Session 1 开始事务。

mysql> START TRANSACTION;
Query OK, rows affected (0.00 sec) mysql> UPDATE user SET name='wentasy' WHERE id = ;
Query OK, row affected (0.00 sec)
Rows matched: Changed: Warnings: 0
-- 此时已经开始事务,所以 innodb_trx 表会有记录。

mysql> SELECT * FROM information_schema.innodb_trx \G
*************************** 1. row ***************************
trx_id: 360E
trx_state: RUNNING
trx_started: 2015-01-27 15:23:49
trx_requested_lock_id: NULL
trx_wait_started: NULL
trx_weight: 3
trx_mysql_thread_id: 1
trx_query: SELECT * FROM information_schema.innodb_trx
trx_operation_state: NULL
trx_tables_in_use: 0
trx_tables_locked: 0
trx_lock_structs: 2
trx_lock_memory_bytes: 376
trx_rows_locked: 1
trx_rows_modified: 1
trx_concurrency_tickets: 0
trx_isolation_level: REPEATABLE READ
trx_unique_checks: 1
trx_foreign_key_checks: 1
trx_last_foreign_key_error: NULL
trx_adaptive_hash_latched: 0
trx_adaptive_hash_timeout: 10000
1 row in set (0.00 sec) -- 此时没有发生锁等待,故 innodb_locks表 和 innodb_lock_waits 表都没有数据。
mysql> SELECT * FROM information_schema.innodb_locks \G
Empty set (0.00 sec) mysql> SELECT * FROM information_schema.innodb_lock_waits \G
Empty set (0.00 sec)

Session 2 更新数据。

mysql> USE test;
mysql> UPDATE user SET name="lock_waits" WHERE ID = ;

Session 1 查看 innodb_trx 表、innodb_locks 表和 innodb_lock_waits 表,可以查看到数据。

在 innodb_trx 表的第一行,trx_id 为 360F 表示第二个事务,状态为等待状态,请求的锁 ID 为 360F:243:3:3,线程 ID 为 2,事务用到的表为 1,有 1 个表被锁。第二行中,trx_id 为 360E 表示第一个事务。

mysql> SELECT * FROM information_schema.innodb_trx \G
*************************** . row ***************************
trx_id: 360F
trx_state: LOCK WAIT
trx_started: -- ::
trx_requested_lock_id: 360F:::
trx_wait_started: -- ::
trx_weight:
trx_mysql_thread_id:
trx_query: UPDATE user SET name="lock_waits" WHERE ID =
trx_operation_state: starting index read
trx_tables_in_use:
trx_tables_locked:
trx_lock_structs:
trx_lock_memory_bytes:
trx_rows_locked:
trx_rows_modified:
trx_concurrency_tickets:
trx_isolation_level: REPEATABLE READ
trx_unique_checks:
trx_foreign_key_checks:
trx_last_foreign_key_error: NULL
trx_adaptive_hash_latched:
trx_adaptive_hash_timeout:
*************************** . row ***************************
trx_id: 360E
trx_state: RUNNING
trx_started: -- ::
trx_requested_lock_id: NULL
trx_wait_started: NULL
trx_weight:
trx_mysql_thread_id:
trx_query: SELECT * FROM information_schema.innodb_trx
trx_operation_state: NULL
trx_tables_in_use:
trx_tables_locked:
trx_lock_structs:
trx_lock_memory_bytes:
trx_rows_locked:
trx_rows_modified:
trx_concurrency_tickets:
trx_isolation_level: REPEATABLE READ
trx_unique_checks:
trx_foreign_key_checks:
trx_last_foreign_key_error: NULL
trx_adaptive_hash_latched:
trx_adaptive_hash_timeout:
rows in set (0.00 sec) mysql> SELECT * FROM information_schema.innodb_locks \G
*************************** . row ***************************
lock_id: 360F:::
lock_trx_id: 360F
lock_mode: X
lock_type: RECORD
lock_table: `test`.`user`
lock_index: `PRIMARY`
lock_space:
lock_page:
lock_rec:
lock_data:
*************************** . row ***************************
lock_id: 360E:::
lock_trx_id: 360E
lock_mode: X
lock_type: RECORD
lock_table: `test`.`user`
lock_index: `PRIMARY`
lock_space:
lock_page:
lock_rec:
lock_data:
rows in set (0.00 sec) mysql> SELECT * FROM information_schema.innodb_lock_waits \G
*************************** . row ***************************
requesting_trx_id: 360F
requested_lock_id: 360F:::
blocking_trx_id: 360E
blocking_lock_id: 360E:::
row in set (0.00 sec)

由于默认的 innodb_lock_wait_timeout 是 50 秒,所以 50 秒过后,Session 2 出现如下提示:

ERROR  (HY000): Lock wait timeout exceeded; try restarting transaction