MySQL优化(三):优化数据库对象

时间:2022-06-07 05:59:49

二、优化数据库对象

1、优化表的数据类型

      应用设计的时候需要考虑字段的长度留有一定的冗余,但不推荐很多字段都留有大量的冗余,这样既浪费磁盘空间,也在应用操作时浪费物理内存。

      在MySQL中,可以使用函数PROCEDURE ANALYSE()对表进行分析,给出优化建议。(16,  256)是指不为包含的值多于16或者256字节的ENUM类型提出建议。

      MySQL优化(三):优化数据库对象

      Optimal_fieldtype为优化建议,可以通过alter修改字段类型:ALTER TABLE TAB_NAME MODIFY COLUMN Optimal_fieldtype_VALUE;

2、逆规范化

      反规划的好处是降低连接操作的需求、降低外码和索引的数目、减少表的数目,带来的问题可能会出现数据的完整性问题,虽然查询加快,但是会降低修改速度。在进行反规范操作之前,要充分考虑数据的存取需求、常用表的大小、一些特殊的计算、数据的物理存储位置。常用的反规范技术如下:

      - 增加冗余列:指在多个表中具有相同的列,它常用来查询时避免连接操作。

      - 增加派生列:指增加的列来自其他表中的数据,由其他表中的数据经过计算生成,作用是减少连接操作,避免使用集函数。

      - 重新组表:指如果许多用户需要查看两个表连接出来的结果数据,则把这两个表重新组成一个表来减少连接而提高性能。

      - 分库分表:https://www.cnblogs.com/dukuan/p/9480610.html

3、使用中间表提高统计查询速度

      对于数据量较大的表,在其上进行统计查询通常会效率很低,并且还会对线上应用产生负面影响。此种情况下可以使用中间表提高统计查询的效率。

      一般步骤:创建表结构和原表结构相同的表,迁移数据需要统计的数据,进行统计。

      中间表在统计查询中的优点:

          - 中间表复制源表数据,并且与源表相“隔离”,在中间表上做统计查询不会对线上应用产生负面影响。

          - 中间表上可以灵活的添加索引或增加临时用的新字段,从而达到提高统计查询效率和辅助统计查询作用。 

三、锁问题

1、锁概述

      MyISAM和MEMORY存储引擎采用表级锁,BDB存储引擎(MySQL5.1后不直接支持此存储引擎)采用的页面锁,也支持表级锁,InnoDB支持行级锁和表级锁,默认是行级。

      - 表级锁:开销小,加锁快,不会出现死锁,锁定粒度大,发生锁冲突的概率最高,并发度最低。

      - 行级锁:开销大,加锁慢,会出现死锁,锁定粒度小,发生冲突的概率最低,并发度也最高。

      - 页面锁:开销和加锁时间界于表锁和行锁之间,会出现死锁,锁定粒度界于表锁和行锁之间,并发度一般。

      表级锁更适合以查询为主,只有少量按索引条件更新数据的应用,如Web应用。而行级锁更适合有大量按索引条件并发更新少量不同数据,同时又有并发查询的应用,如在线事物处理系统。

2、MyISAM表锁

      MyISAM只支持表锁。

2.1 查询表级锁争用情况

      MySQL优化(三):优化数据库对象

      Table_locks_immediate:产生表级锁定的次数。

      如果Table_locks_waited比较高,说明存在着严重的表级锁争用情况。

2.2 MySQL表级锁的锁模式

      表级锁分为表共享读锁和表独占写锁。兼容性如下:

      MySQL优化(三):优化数据库对象

      对于MyISAM表的读操作,不会阻塞其他用户对同一表的读请求,但会阻塞对同一个表的写请求。对表的写操作,会阻塞同一表的读和写。MyISAM读操作和写操作以及写操作之间是串行的。

2.3 如何加锁表

      MyISAM在执行SELECT、UPDATE、DELETE、INSERT前,会自动给涉及的表加锁,无需用户干预。

      显式加锁情况:比如同时要查询或者比对两个表中的内容,为防止在查其中一个时另一个有更新或者新数据,此时需要显式的为两个表加锁。

      加锁命令:LOCK TABLES tab_name READ LOCAL, tab_name2 READ LOCAL;  -- LOCAL表示允许其他用户在MyISAM表尾并发插入记录。使用显式加锁时,必须同时取得所有涉及表的锁,而且加锁后只能访问加锁的这些表,不能访问其他表。并且如果加的是读锁,那么只能执行查询操作。并且加锁时需要对别名也要加锁。

2.4 MyISAM并发插入

      MyISAM通过concurrent_insert参数决定是否允许并发插入

      - 0:不允许并发插入

      - 1:MyISAM表中无空洞,允许读的同时在表末尾插入记录。默认设置

      - 2:无论是否有无空洞,都能插入。

      可以利用并发插入特性来解决应用中对同一表查询和插入的锁争用。同时定期在系统空闲时整理空间碎片,收回因删除记录而产生的中间空洞。

      注意:只能insert不能update和delete。且锁表的session不能获取到新插入到的数据。

2.5 MyISAM的锁调度

      同一时刻请求的写锁和读锁,MySQL会优先处理写进程。即使是读请求先到等待队列,写锁也会插入到读锁请求之前,这也是MyISAM表不太适合于有大量更新操作和查询操作应用的原因。

      调节MyISAM的调度行为:

      - 通过制定启动参数low-priority-updates, 使MyISAM引擎默认给予读请求以优先的权利。

      - 通过执行命令 SET LOW_PRIORITY_UPDATES = 1,来降低更新请求的优先级。

      - 通过制定INSERT、UPDATE、DELETE语句的LOW_PRIORITY属性,降低该语句的优先级。

      MySQL也提供了一种折中的办法,即给系统参数max_write_lock_count设置一个合适的值,当一个表的读锁达到这个值后,MySQL就暂时将写请求的优先级降低。

3、InnoDB锁问题

3.1 背景知识

3.1.1 事务及其ACID属性

      事务是由一组SQL语句组成的逻辑处理单元,具有以下4个属性,通常简称为事务的ACID属性。

      - 原子性:事务是一个原子操作单元,其对数据的修改,要么全部执行,要么全都不执行。

      - 一致性:在事务开始和完成时,数据都必须保持一致状态。这意味着所有相关的数据规则都必须应用于事务的修改,以保持数据的完整性;事务结束时,所有的内部数据结构也都必须是正确的。

      - 隔离性:数据库系统提供一定的隔离机制,保证事务在不受外部并发操作影响的独立环境执行。

      - 持久性:事务完成之后,它对于数据的修改是永久性的,即使出现系统故障也能够保持。

3.1.2 并发事务处理的问题

      相对于串行处理来说,并发事务处理能大大增加数据库资源利用率,提供吞吐量,但会引起下列问题:

      - 更新丢失:两个或多个事务同时操作同一行,会覆盖其他事务的更新。

      - 脏读:当一个事务在对一条记录做修改未完成并提交前,另一个事务来读取同一条记录,这时读取到的数据叫脏读。

      - 不可重复读:一个事务在读取某些数据后的某个时间,再次读取,发现读出的数据已经发生了改变或某些记录已经被删除了。

      - 幻读:一个事务按相同的查询条件重新读取以前检索过的数据,其他事务插入了满足其条件的新数据。

3.1.3 事务隔离级别

      线上业务应完全避免更新丢失,但是避免此情况需要应用程序对要更新的数据加必要的锁来解决。但是关于读一致性,必须由数据库提供一定的事务隔离机制来解决。数据库事务隔离的方式,基本上可分为以下两种:

      - 在读取数据之前,对其加锁。 

      - 使用数据多版本并发控制(MVCC/MCC),按照请求时间点创建快照。

      数据库的事务隔离越严格,并发副作用越小,相应的代价也就越大,因为事务隔离实质是进行"串行化"。

      为了解决隔离和并发的矛盾,ISO/ANSI SQL92定义了4个事务隔离级别。应用可以根据自己的业务逻辑要求,选择不同的隔离级别来平衡隔离和并发的矛盾。

      MySQL优化(三):优化数据库对象

3.2 获取InnoDB行锁争用情况

      MySQL优化(三):优化数据库对象

      如果Innodb_row_lock_waits和Innodb_row_lock_time_avg的值比较高,则争用比较严重。

      此时可以通过查询information_schema数据库中的表来查看锁情况,或者通过设置InnoDB Monitors来观察发生锁冲突的表、数据行等。

      - 通过information_schema

        SELECT * FROM innodb_locks;

        SELECT * FROM innodb_lock_waits;

      - 通过InnoDB Monitors

        CREATE TABLE innodb_monitor(a INT) ENGINE = INNODB;

        然后通过:SHOW ENGINE INNODB STATUS查看

        关闭监视器:DROP TABLE innodb_monitor;

3.3 InnoDB行锁模式及加锁方法

      InnoDB实现了两种类型的行锁:

      - 共享锁:允许另一个事务也获得共享锁,但是阻止其他事务获得相同数据集的排他锁。

      - 排他锁:允许获得排他锁的事务更新数据,阻止其他事务取得相同数据集的共享读锁和排他写锁。

      事务获取锁的方式:

      - 共享锁:SELECT ... WHERE ... LOCK IN SHARE MODE;

      - 排他锁:SELECT ... WHERE ... FOR UPDATE;

      对于锁定行后需要进行更新操作的应用,用过使用排他锁。

3.4 InnoDB行锁实现方式

      InnoDB行锁是通过索引上的索引项加锁来实现的,如果没有索引,InnoDB将通过隐藏的聚簇索引来记录加锁。分为3种情形:

      - Record lock:对索引项加锁。

      - Gap lock:对索引项之间的“间隙”、第一条记录前的“间隙”或最后一条记录后的“间隙”加锁。

      - Next-key lock:前两种的组合,对记录及其前面的间隙加锁。

      注意:如果不通过索引条件检索数据,那么InnoDB将对表中的所有记录加锁,等同于表锁,生产环境中需要注意这一特性防止导致大量的锁冲突,从而影响并发性能。

      由于MySQL的行锁是针对索引加的锁,不是针对记录加的锁,所以虽然是访问不同行的记录,但是如果使用相同的索引建,会出现锁冲突。

      当表有多个索引的时候,不同的事务可以使用不同的索引锁定不同的行,但是当不同的session查询相同的数据时,同样会阻塞。

      当表的数据较少,此时MySQL可能会全盘扫描,此时会导致不使用索引查询,进而导致全表加锁。

      MySQL检索的数据类型与索引字段不同,会进行数据转换,但却不会使用索引,所以会导致InnoDB对所有的记录加锁。

3.5 Next-Key锁

      当我们使用范围查询,并请求共享或排他锁时,InnoDB会给符合条件的所有索引项加锁,对于在范围内但是不存在的记录,叫做间隙GAP,同时也会被加锁,这个锁叫做Next-Key锁。Next-Key锁时为了防止幻读。

      当使用范围检索并锁定记录时,InnoDB会阻塞条件范围内键值的并发插入,这往往会造成严重的锁等待。因此,在实际应用开发中,尤其是并发插入比较多的应用,尽量使用相等条件来访问更新数据,避免使用范围条件。

 3.6 什么时候使用行级锁

      对于InnoDB,绝大部分情况下都应该使用行级锁,个别特殊事务中,可以考虑使用表级锁。

      - 事务需要更新大部分或全部数据,表比较大,如果使用默认的行锁,会造成事务执行效率低,而且可能造成其他事务长时间锁等待和锁冲突。这种情况考虑使用表锁来提高事务的执行速度。

      - 事务设计多个表,比较复杂,很可能引起死锁,造成大量事务回滚,此时可考虑使用表锁避免死锁,减少数据库因事务回滚带来的开销。

      当然,生产环境中最好不要出现这两种事务,否则就应该考虑MyISAM了。

      表锁注意事项:

      - 表锁不是由InnoDB存储引擎管理的,而是由MySQL Server负责的,仅当autocommit=0,innodb_table_locas=1(缺省值)时,InnoDB才能知道MySQL加的表锁,也才能感知InnoDB加的行锁, 这种情况下,InnoDB才能自动识别涉及表级锁的死锁,否则InnoDB将无法自动检测并处理这种死锁。

      - 在用LOCK TABLES对InnoDB加锁时,需要将AUTOCOMMIT设为0,否则不会给表加锁;事务结束前,不要用UNLOCKS TABLES释放表锁,因为UNLOCK TABLES会隐含提交事务;COMMIT或ROLLBACK并不能释放用LOCK TABLES加的表级锁,必须用UNLOCK TABLES释放表锁。

        方式如下:写表t1并从表t2读

        SET AUTOCOMMIT = 0;

        LOCK TABLES t1 WRITE, t2 READ;

        [do something..] 

        COMMIT;

        UNLOCK TABLES;

3.7 关于死锁

      MyISAM表锁是一次获得所需全部锁,要么全部满足,要么等待,因为不会出现死锁。但InnoDB锁是逐步获得的,所以InnoDB会发生死锁的可能。

      比如:session1正在对table_1进行 select for update(获得tb1排他锁) ,此时session2对table_2进行select for update(获得tb2排他锁),如果此时session1对tb2进行select for update,会出现等待,直到session2释放,但是如果session2没有释放并且又请求tb1进行select for update,那么此时会出现死锁。

      发生死锁后,InnoDB一般都能自动检测到,然后释放一个事务锁并回退,另一个事务获得锁继续完成事务。但在涉及外部锁或涉及锁的情况下,InnoDB并不能完全自动检测到死锁,这需要通过设置锁超时参数innodb_lock_wait_timeout来解决,但这个参数并不是用来解决死锁问题,在并发访问比较高的情况下,如果大量事务因无法立即获得所需的锁而挂起,会拖垮数据库,设置合适的值可以避免或者减少此种情况的发生。

      通常来说,死锁都是应用设计的问题,通过调整业务流程、数据库对象设计、事务大小,以及访问数据库的SQL语句,绝大部分死锁都可以避免。

      避免死锁的常用方法:

      - 程序并发存取多个表,尽量约定相同的顺序来访问量。        

      - 程序批量处理数据的时候,事先对数据排序,保证每个线程按固定的顺序来处理记录。

      - 在事务中,如果要更新记录,应该直接申请足够级别的排他锁,而不是先申请共享锁,后申请排他锁。要不然其他事务可能已经获得了相同的共享锁,从而造成锁冲突。

      - 在REPEATABLE-READ隔离级别下,如果两个线程同时对相同条件记录用SELECT FOR UPDATE加排他锁,在没有符合条件的记录的情况下,两个线程都会加锁成功。因为两个线程查询均无此记录,便会尝试插入一条新纪录,如果两个线程都这么做,就会出现死锁。这种情况将隔离级别改成READ COMMITTED就可避免。