MySQL具体解释(21)------------缓存參数优化

时间:2021-04-14 04:44:48

数据库属于 IO 密集型的应用程序。其主要职责就是数据的管理及存储工作。

而我们知道,从内存中读取一个数据库的时间是微秒级别,而从一块普通硬盘上读取一个IO是在毫秒级别,二者相差3个数量级。所以,要优化数据库。首先第一步须要优化的就是 IO,尽可能将磁盘IO转化为内存IO。本文先从 MySQL 数据库IO相关參数(缓存參数)的角度来看看能够通过哪些參数进行IO优化

query_cache_size/query_cache_type (global)

Query cache 作用于整个 MySQL Instance,主要用来缓存 MySQL 中的 ResultSet。也就是一条SQL语句运行的结果集,所以只只能针对select语句。

当我们打开了 Query Cache 功能。MySQL在接受到一条select语句的请求后。假设该语句满足Query Cache的要求(未显式说明不同意使用Query Cache。或者已经显式申明须要使用Query Cache),MySQL 会直接依据预先设定好的HASH算法将接受到的select语句以字符串方式进行hash,然后到Query
Cache 中直接查找是否已经缓存。

也就是说。假设已经在缓存中。该select请求就会直接将数据返回,从而省略了后面全部的步骤(如 SQL语句的解析,优化器优化以及向存储引擎请求数据等),极大的提高性能。

当然,Query Cache 也有一个致命的缺陷,那就是当某个表的数据有不论什么不论什么变化,都会导致全部引用了该表的select语句在Query Cache 中的缓存数据失效。

所以,当我们的数据变化很频繁的情况下,使用Query Cache 可能会得不偿失。

Query Cache的使用须要多个參数配合。当中最为关键的是 query_cache_size 和 query_cache_type 。前者设置用于缓存 ResultSet 的内存大小,后者设置在何场景下使用 Query Cache。

在以往的经验来看,假设不是用来缓存基本不变的数据的MySQL数据库,query_cache_size 一般 256MB 是一个比較合适的大小。

当然。这能够通过计算Query Cache的命中率(Qcache_hits/(Qcache_hits+Qcache_inserts)*100))来进行调整。query_cache_type能够设置为0(OFF),1(ON)或者2(DEMOND),分别表示全然不使用query
cache,除显式要求不使用query cache(使用sql_no_cache)之外的全部的select都使用query cache,仅仅有显示要求才使用query cache(使用sql_cache)。

binlog_cache_size (global)

Binlog Cache 用于在打开了二进制日志(binlog)记录功能的环境。是 MySQL 用来提高binlog的记录效率而设计的一个用于短时间内暂时缓存binlog数据的内存区域。

一般来说,假设我们的数据库中没有什么大事务,写入也不是特别频繁,2MB~4MB是一个合适的选择。

可是假设我们的数据库大事务较多,写入量比較大,可与适当调高binlog_cache_size。同一时候,我们能够通过binlog_cache_use 以及 binlog_cache_disk_use来分析设置的binlog_cache_size是否足够,是否有大量的binlog_cache因为内存大小不够而使用暂时文件(binlog_cache_disk_use)来缓存了。

key_buffer_size (global)

Key Buffer 可能是大家最为熟悉的一个 MySQL 缓存參数了,尤其是在 MySQL 没有更换默认存储引擎的时候。非常多朋友可能会发现,默认的 MySQL 配置文件里设置最大的一个内存參数就是这个參数了。key_buffer_size 參数用来设置用于缓存 MyISAM存储引擎中索引文件的内存区域大小。假设我们有足够的内存,这个缓存区域最好是可以存放下我们全部的 MyISAM 引擎表的全部索引。以尽可能提高性能。

此外,当我们在使用MyISAM 存储的时候有一个及其重要的点须要注意。因为 MyISAM 引擎的特性限制了他只只会缓存索引块到内存中。而不会缓存表数据库块。

所以,我们的 SQL 一定要尽可能让过滤条件都在索引中。以便让缓存帮助我们提高查询效率。

bulk_insert_buffer_size (thread)

和key_buffer_size一样,这个參数相同也仅作用于使用 MyISAM存储引擎,用来缓存批量插入数据的时候暂时缓存写入数据。当我们使用例如以下几种数据写入语句的时候,会使用这个内存区域来缓存批量结构的数据以帮助批量写入数据文件:

insert … select …

insert … values (…) ,(…),(…)…

load data infile… into… (非空表)

innodb_buffer_pool_size(global)

当我们使用InnoDB存储引擎的时候,innodb_buffer_pool_size 參数可能是影响我们性能的最为关键的一个參数了,他用来设置用于缓存 InnoDB 索引及数据块的内存区域大小。类似于 MyISAM 存储引擎的 key_buffer_size 參数,当然,可能更像是 Oracle 的 db_cache_size。简单来说,当我们操作一个 InnoDB 表的时候。返回的全部数据或者去数据过程中用到的不论什么一个索引块,都会在这个内存区域中走一遭。

和key_buffer_size 对于 MyISAM 引擎一样,innodb_buffer_pool_size 设置了 InnoDB 存储引擎需求最大的一块内存区域的大小,直接关系到 InnoDB存储引擎的性能,所以假设我们有足够的内存。尽可将该參数设置到足够打,将尽可能多的 InnoDB 的索引及数据都放入到该缓存区域中,直至所有。

我们能够通过 (Innodb_buffer_pool_read_requests – Innodb_buffer_pool_reads) / Innodb_buffer_pool_read_requests * 100% 计算缓存命中率。并依据命中率来调整 innodb_buffer_pool_size 參数大小进行优化。

innodb_additional_mem_pool_size(global)

这个參数我们平时调整的可能不是太多,非常多人都使用了默认值,可能非常多人都不是太熟悉这个參数的作用。innodb_additional_mem_pool_size 设置了InnoDB存储引擎用来存放数据字典信息以及一些内部数据结构的内存空间大小,所以当我们一个MySQL Instance中的数据库对象非常多的时候,是须要适当调整该參数的大小以确保全部数据都能存放在内存中提高訪问效率的。

这个參数大小是否足够还是比較easy知道的,由于当过小的时候,MySQL 会记录 Warning 信息到数据库的 error log 中,这时候你就知道该调整这个參数大小了。

innodb_log_buffer_size (global)

这是 InnoDB 存储引擎的事务日志所使用的缓冲区。类似于 Binlog Buffer,InnoDB 在写事务日志的时候。为了提高性能。也是先将信息写入 Innofb Log Buffer 中,当满足 innodb_flush_log_trx_commit 參数所设置的对应条件(或者日志缓冲区写满)之后,才会将日志写到文件(或者同步到磁盘)中。

能够通过 innodb_log_buffer_size 參数设置其能够使用的最大内存空间。

注:innodb_flush_log_trx_commit 參数对 InnoDB Log 的写入性能有很关键的影响。

该參数能够设置为0,1,2,解释例如以下:

0:log buffer中的数据将以每秒一次的频率写入到log file中。且同一时候会进行文件系统到磁盘的同步操作,可是每一个事务的commit并不会触发不论什么log buffer 到log file的刷新或者文件系统到磁盘的刷新操作。

1:在每次事务提交的时候将log buffer 中的数据都会写入到log file。同一时候也会触发文件系统到磁盘的同步;

2:事务提交会触发log buffer 到log file的刷新,但并不会触发磁盘文件系统到磁盘的同步。此外。每秒会有一次文件系统到磁盘同步操作。

此外,MySQL文档中还提到。这几种设置中的每秒同步一次的机制,可能并不会全然确保很准确的每秒就一定会发生同步,还取决于进程调度的问题。实际上。InnoDB 是否能真正满足此參数所设置值代表的意义正常 Recovery 还是受到了不同 OS 下文件系统以及磁盘本身的限制。可能有些时候在并没有真正完毕磁盘同步的情况下也会告诉 mysqld 已经完毕了磁盘同步。

innodb_max_dirty_pages_pct (global)

这个參数和上面的各个參数不同,他不是用来设置用于缓存某种数据的内存大小的一个參数。而是用来控制在 InnoDB Buffer Pool 中可以不用写入数据文件里的Dirty Page 的比例(已经被修但还没有从内存中写入到数据文件的脏数据)。这个比例值越大,从内存到磁盘的写入操作就会相对降低。所以可以一定程度下降低写入操作的磁盘IO。

可是,假设这个比例值过大,当数据库 Crash 之后重新启动的时间可能就会非常长。由于会有大量的事务数据须要从日志文件恢复出来写入数据文件里。同一时候,过大的比例值同一时候可能也会造成在达到比例设定上限后的 flush 操作“过猛”而导致性能波动非常大。

上面这几个參数是 MySQL 中为了降低磁盘物理IO而设计的主要參数。对 MySQL 的性能起到了至关关键的数据。
 
—EOF—
 
依照 mcsrainbow 朋友的要求。这里列一下依据以往经验得到的相关參数的建议值:
  • query_cache_type : 假设全部使用innodb存储引擎,建议为0,假设使用MyISAM 存储引擎,建议为2。同一时候在SQL语句中显式控制是否是哟你gquery cache
  • query_cache_size: 依据 命中率(Qcache_hits/(Qcache_hits+Qcache_inserts)*100))进行调整,一般不建议太大。256MB可能已经差点儿相同了。大型的配置型静态数据可适当调大
  • binlog_cache_size: 一般环境2MB~4MB是一个合适的选择。事务较大且写入频繁的数据库环境能够适当调大,但不建议超过32MB
  • key_buffer_size: 假设不使用MyISAM存储引擎,16MB足以,用来缓存一些系统表信息等。假设使用 MyISAM存储引擎。在内存同意的情况下,尽可能将全部索引放入内存,简单来说就是“越大越好”
  • bulk_insert_buffer_size: 假设常常性的须要使用批量插入的特殊语句(上面有说明)来插入数据,能够适当调大该參数至16MB~32MB,不建议继续增大,某人8MB
  • innodb_buffer_pool_size: 假设不使用InnoDB存储引擎,能够不用调整这个參数。假设须要使用,在内存同意的情况下,尽可能将全部的InnoDB数据文件存放如内存中,相同将但来说也是“越大越好”
  • innodb_additional_mem_pool_size: 一般的数据库建议调整到8MB~16MB。假设表特别多。能够调整到32MB。能够依据error log中的信息推断是否须要增大
  • innodb_log_buffer_size: 默认是1MB,系的如频繁的系统可适当增大至4MB~8MB。当然如上面介绍所说。这个參数实际上还和另外的flush參数相关。一般来说不建议超过32MB
  • innodb_max_dirty_pages_pct: 依据以往的经验,重新启动恢复的数据假设要超过1GB的话,启动速度会比較慢,差点儿难以接受,所以建议不大于 1GB/innodb_buffer_pool_size(GB)*100 这个值。当然,假设你能够忍受启动时间比較长,并且希望尽量降低内存至磁盘的flush,能够将这个值调整到90,但不建议超过90

注:以上取值范围只不过我的依据以往遇到的数据库场景所得到的一些优化经验值,并不一定适用于全部场景,所以在实际优化过程中还须要大家自己不断的调整分析。也欢迎大家随时通过 Mail 与我联系沟通交流优化或者是架构方面的技术,一起探讨相互学习。