上一篇介绍了Innodb的同步机制锁:Innodb锁系列1
这一篇介绍一下Innodb的事务锁,只所以称为事务锁,是因为Innodb为实现事务的ACID特性,而添加的表锁或者行级锁。
这一部分分两篇来介绍,先来介绍下事务锁相关的数据结构
事务锁数据结构
1. 锁模式
/* Basic lock modes */
enum lock_mode {
LOCK_IS = , /* intention shared */
LOCK_IX, /* intention exclusive */
LOCK_S, /* shared */
LOCK_X, /* exclusive */
LOCK_AUTO_INC, /* locks the auto-inc counter of a table in an exclusive mode */
LOCK_NONE, /* this is used elsewhere to note consistent read */
LOCK_NUM = LOCK_NONE/* number of lock modes */
};
锁的模式包括两大类,共享锁(S)和互斥锁(X),s/x锁可以加在表上或者行记录上,
比如:
session1:alter table: table类型的X锁
session2:select * from table where id =1 for update: record类型的X锁
因为session1和session2互斥,为了实现在table表上阻塞,所以session2增加了表锁(IS),这样session2无法获取IS锁而阻塞。
LOCK_AUTO_INC:自增锁,为了保证在多行插入的时候,自增键值是连续的。
2. 表锁和记录锁数据结构
--表锁
struct lock_table_struct {
dict_table_t* table; /*!< database table in dictionary cache */
UT_LIST_NODE_T(lock_t) locks; /*!< list of locks on the same table */
};
--行锁
struct lock_rec_struct {
ulint space; /*!< space id */
ulint page_no; /*!< page number */
ulint n_bits; /*!< number of bits in the lock
bitmap; NOTE: the lock bitmap is
placed immediately after the
lock struct */
};
--锁记录
struct lock_struct {
trx_t* trx; /*!< transaction owning the lock */
UT_LIST_NODE_T(lock_t)
trx_locks; /*!< list of the locks of the transaction */
ulint type_mode; /*!< lock type, mode, LOCK_GAP or
LOCK_REC_NOT_GAP,
LOCK_INSERT_INTENTION,
wait flag, ORed */
hash_node_t hash; /*!< hash chain node for a record lock */
dict_index_t* index; /*!< index for a record lock */
union {
lock_table_t tab_lock;/*!< table lock */
lock_rec_t rec_lock;/*!< record lock */
} un_member; /*!< lock details */
};
表锁:使用表的数据字典进行标示,并保持一个链表,记录table上的所有锁记录。
记录锁:记录锁使用space+page_no唯一进行标示一个page页,n_bits标示这个页的记录,1表示加锁。
锁记录:lock_t表示一个锁记录,事务锁永远都和trx关联,trx_locks表示这个事务的所有锁记录。
3. 全局结构
/** The lock system struct */
struct lock_sys_struct{
hash_table_t* rec_hash; /*!< hash table of the record locks */
ulint rec_num;
}; /** The lock system */
extern lock_sys_t* lock_sys;
Innodb建立了一个全局的hash表,所有事务添加的锁,都记录在全局的事务表中,并使用record的space+page_no进行hash bucket的计算。入下图所示:
对于不同的space+page_no,通过hash key计算,映射到不同的bucket上,对于比如两条不同的update语句更新同一条记录的时候,不同的session,分别创建lock_t并加入到node1和node2中。这样就实现了所有的事务锁维护在hash+link的结构中。
不同的bucket互不影响,所有的wait,signal都通过相同的bucket下的链表来实现。
我们可以看一个函数就比较清楚了:
通过扫描hash结构+link结构来计算当前系统上有多少lock_t.
lock_get_n_rec_locks(void)
{
lock_t* lock;
ulint n_locks = ;
ulint i;
ut_ad(mutex_own(&kernel_mutex));
for (i = ; i < hash_get_n_cells(lock_sys->rec_hash); i++) {
lock = HASH_GET_FIRST(lock_sys->rec_hash, i);
while (lock) {
n_locks++;
lock = HASH_GET_NEXT(hash, lock);
}
}
return(n_locks);
}
注:所有的lock_t统计信息,以及锁的相容性测试对象,wait和signal的操作,都是通过这个全局结构进行实现的。
4. 锁的gap模式
#define LOCK_ORDINARY 0
#define LOCK_GAP 512
#define LOCK_REC_NOT_GAP 1024
行级锁实现的gap模式:
1. record lock:记录锁,根据索引记录锁主单行记录
2. gap lock:gap锁,锁住一个记录的区间
3. next-gap lock:包含了记录锁和gap锁
锁的gap模式主要为了实现以下:
1. 丢失更新:对于多事务更新相同的记录,需要记录锁保证事务间的互斥,防止丢失更新。
2. 可重复读:在read repeatable的事务隔离级别下,需要锁住记录的gap,来保证可重复读。
5. 隐式锁和显式锁
对于cluster index的记录锁而言,如select * from table where id=1 for update而言,会显示的在id=1的聚簇索引上添加行级锁。
如果是update语句,除了在cluster_index上添加锁以为,还需要在二级索引上添加锁。
但cluster index添加的是显示的锁,而二级索引使用隐式锁。
隐式锁: 是一种延迟的加锁方式,毕竟加锁是有开销的,所以使用一种乐观的方式,因为主键索引记录上有trx_id,如果判断主键记录上的trx_id是活动的事务,那么才加显示的锁。
这样,最大化的减少记录加锁的机会。
下一篇介绍具体的加锁过程: