MySQL - 两种存储引擎 (MyISAM PK InnoDB) MVCC

时间:2022-04-15 07:22:14

总结

1.两种存储引擎各有各的有点,MyISAM专注性能,InnoDB专注事务。两者最大的区别就是InnoDB支持事务,和行锁。

MySQL - 两种存储引擎 (MyISAM PK InnoDB)   MVCC

 

2.InnoDB采用MVCC(Multi-Version Concurrency Control 多版本并发控制)来支持高并发,一种行级锁的变种。MVCC是通过保存数据在某一个时间点的快照来实现的,也就是说无论事务执行多久,每个事务看到的数据都是一致的。InnoDB的MVCC,是通过在每行记录后面保存两个隐藏的列来实现,这两个列一个保存了行的创建时间,一个保存了行的过期时间(或删除时间),当然,并非存储的是时间,而是系统版本号。每开启一个事务,版本号都会递增,事务开始时刻的系统版本号会作为事务的版本号。

注:MVCC只在REPEATABLE和READ COMMITTED两个隔离级别下才能正常工作。

 

id name 创建时间(行版本号) 删除时间(删除版本号)
1 Mary 1 null
2 Jann 1 null

 

背景介绍

MyISAM

是MySQL的默认数据库引擎(5.5版之前),由早期的ISAM(Indexed Sequential Access Method:有索引的顺序访问方法)所改良。虽然性能极佳,但却有一个缺点:不支持事务处理(transaction)。不过,在这几年的发展下,MySQL也导入了InnoDB(另一种数据库引擎),以强化参考完整性与并发违规处理机制,后来就逐渐取代MyISAM。

InnoDB

是MySQL的数据库引擎之一,为MySQL AB发布binary的标准之一。InnoDB由Innobase Oy公司所开发,2006年五月时由甲骨文公司并购。与传统的ISAM与MyISAM相比,InnoDB的最大特色就是支持了ACID兼容的事务(Transaction)功能,类似于PostgreSQL。目前InnoDB采用双轨制授权,一是GPL授权,另一是专有软件授权。

MySQL - 两种存储引擎 (MyISAM PK InnoDB)   MVCC

 

 

 

InnoDB存储引擎

InnoDB是默认的事务型存储引擎,也是最重要,使用最广泛的存储引擎。在没有特殊情况下,一般优先使用InnoDB存储引擎。

1.数据存储形式

使用InnoDB时,会将数据表分为.frm 和 idb两个文件进行存储。

MySQL - 两种存储引擎 (MyISAM PK InnoDB)   MVCC

2.锁的粒度

InnoDB采用MVCC(多版本并发控制)来支持高并发,InnoDB实现了四个隔离级别,默认级别是REPETABLE READ,并通过间隙锁策略防止幻读的出现。它的锁粒度是行锁。【通过MVCC实现,MVCC在稍后会进行介绍】

3.事务

InnoDB是典型的事务型存储引擎,并且通过一些机制和工具,支持真正的热备份。

4.数据的存储特点

InnoDB表是基于聚簇索引??(另一篇博客有介绍)建立的,聚簇索引对主键的查询有很高的性能,不过他的二级索引(非主键索引)必须包含主键列,索引其他的索引会很大。

MyISAM存储引擎

1.数据存储形式

MyISAM采用的是索引与数据分离的形式,将数据保存在三个文件中.frm.MYD,.MYIs。

MySQL - 两种存储引擎 (MyISAM PK InnoDB)   MVCC

2.锁的粒度

MyISAM不支持行锁,所以读取时对表加上共享锁,在写入是对表加上排他锁。由于是对整张表加锁,相比InnoDB,在并发写入时效率很低。

3.事务

MyISAM不支持事务。

4.数据的存储特点

MyISAM是基于非聚簇索引进行存储的。

5.其他

MyISAM提供了大量的特性,包括全文索引,压缩,空间函数,延迟更新索引键等。

  • 进行压缩后的表是不能进行修改的,但是压缩表可以极大减少磁盘占用空间,因此也可以减少磁盘IO,从而提供查询性能。
  • 全文索引,是一种基于分词创建的索引,可以支持复杂的查询。
  • 延迟更新索引键,不会将更新的索引数据立即写入到磁盘,而是会写到内存中的缓冲区中,只有在清除缓冲区时候才会将对应的索引写入磁盘,这种方式大大提升了写入性能。

应用场景

如何在两种存储引擎中进行选择?

① 是否有事务操作?有,InnoDB。

②是否存储并发修改?有,InnoDB。

③是否追求快速查询,且数据修改较少?是,MyISAM。

④是否使用全文索引?如果不引用第三方框架,可以选择MyISAM,但是可以选用第三方框架和InnDB效率会更高。

 

5.数据库的数据有多大? 大尺寸倾向于innodb,因为事务日志,故障恢复。

 

浅谈MVCC(Multi-Version Concurrency Control)

1.MySQL大多数事务型存储引擎实现的都不是简单的行锁。基于提升并发性能的考虑,他们一般都同时实现了多版本并发控制(MVCC)。

2.可以认为MVCC是行级锁的一个变种,它能在大多数情况下避免加锁操作,因此开销更低。无论怎样实现,它们大都实现了非阻塞的读操作,写操作也只锁定制定的行。

3.MVCC是通过保存数据在某一个时间点的快照来实现的,也就是说无论事务执行多久,每个事务看到的数据都是一致的。InnoDB的MVCC,是通过在每行记录后面保存两个隐藏的列来实现,这两个列一个保存了行的创建时间,一个保存了行的过期时间(或删除时间),当然,并非存储的是时间,而是系统版本号。每开启一个事务,版本号都会递增,事务开始时刻的系统版本号会作为事务的版本号。

id name 创建时间(行版本号) 删除时间(删除版本号)
1 Mary 1 null
2 Jann 1 null

以InnoDB存储引擎的的REPEATABLE READ隔离级别来说:

SELECT

? ①只查询创建时间版本号小于当前事务版本号的数据行(保证事务读取的行要么在事务开始之前就存在,要么是事务本身插入的行)

? ②行的删除版本号要么未定义,要么大于当前事务版本号,这样可以确保事务读取到的行,在开始事务之前未被删除

只有复合上诉两个条件的记录才会作为结果返回

INSERT

? 为插入的数据保存当前系统版本号作为行版本号

DELETE

? 保存当前系统版本号作为删除行版本号

UPDATE

? 插入一行数据,并将当前系统版本号赋予行版本号;同时保存当前系统版本号到原来的行作为删除版本号。

注:MVCC只在REPEATABLE和READ COMMITTED两个隔离级别下才能正常工作。

参考

散尽浮华 https://www.cnblogs.com/kevingrace/p/5685355.html

浪人~ https://www.cnblogs.com/liqiangchn/p/9066686.html