问了几人,MySQL changebuffer 这点都没答对

时间:2022-06-03 00:39:06

你好,我是yes。

有位同学问了我两个关于 change buffer 的问题:

问了几人,MySQL changebuffer 这点都没答对

随后我又挑了几个问答的用户提问这两个问题,发现对 change buffer 的理解都有偏差,于是决定操作一篇。

之前我写过一篇关于 mysql innodb 所有 buffer 的内容 :总结 mysql 的所有 buffer,一网打尽就这篇了!

里面有提到 change buffer,这篇算是之前那篇的补充吧。

如果对 mysql innodb buffer 不太熟悉,建议先看下我之前总结的内容,这个还是需要点前置知识的。

简单回顾 change buffer

简单来说 change buffer 就是一块内存,存在于 buffer pool 中,当需要修改数据时候,如果这个数据所在页在 buffer pool,那么万事大吉,直接在内存也修改。

那假设 buffer pool 里没有要修改的那个数据页,这时候该修改怎么办呢?

假设要执行这个 sql:update table set a= 'yes' where b = 1

第一直觉就是找到 b =1 的数据所在的数据页,加载到 buffer pool 中,然后进行修改,这里就涉及了从磁盘拉取数据到内存这个动作,我们都知道读盘的开销是比较大的。

所以 mysql innodb 搞了个 change buffer,当数据页不存在 buffer pool 时,mysql innodb 先把更新动作缓存在 change buffer 中,当下次 select b=1 这个数据的时候,将数据加载到 buffer pool 中,同时应用上 change buffer 的修改,这就得到正确的数据了。

问了几人,MySQL changebuffer 这点都没答对

重点

上述的原理不难理解,不过我之前文章提到了一点:

问了几人,MySQL changebuffer 这点都没答对

这就是重点,理解了这个就能解答上面那位同学的提问。

change buffer 只能应用非唯一二级索引

聚蔟索引和唯一索引都需要检查数据的一致性,这就不好先把更新、插入、删除先缓存在 change buffer 中。

假设现在有一张名为 yes 表,里面有聚蔟索引以及一个(a,b) 的非唯一二级索引,现要执行如下语句:

update yes set b= 'yes的练级攻略' where a = 'yesyes'

思考下,此时能用上 change buffer 吗?

原则上这条更新语句,mysql 可以选择聚蔟索引扫,或者应用 (a,b)这个索引。

假设走(a,b)索引。

那问题来了,要走(a,b)索引,不就是要扫描(a,b)的数据吗,也就是需加载(a,b)索引数据页到 buffer pool 中,那还用啥 change buffer?

听起来 change buffer 好像没啥用啊?

我再加点条件:假设这个表不仅仅有 (a,b)这个索引,还有(c,b)、(d,b)等等这些索引,那么如果我们要修改 b 字段的值,是不是除了聚蔟索引,还需要修改(c,b)、(d,b)等等这些索引?

那 change buffer 的用处就来了!我们可以缓存这些修改,后面再应用,这就大量减少了此次 sql 的随机磁盘 I/O,提高了性能。

看到这,相信你对 change buffer 应该已经有点感觉了,你可以借着这些感觉,去看下官网的介绍,理解起来更容易:

https://dev.mysql.com/doc/refman/5.7/en/innodb-change-buffer.html

回答问题

第一个问题:insert 用 chang buffer 如何确定主键不冲突?

主键索引和唯一索引都需要扫描校验,change buffer 只会缓存那些非唯一二级索引的插入操作。

第二个问题:用 chang buffer 不访问磁盘,如何得到实际修改行数?

chang buffer 无法应用在主键索引(聚蔟索引)和唯一二级索引上,所以这两个得改,主键索引都改了,影响行数就有了。

好了,今天的文章就到这了,如果有收获不妨点给赞。

关于问答我还提供 1v1 个人问答服务,详细可以看这里:我的一对一专属问答服务,简单来说就是你有任何面试、技术上的问题都可以直接微信向我提问。

我是yes,从一点点到亿点点我们下篇见~