合理的表结构、索引对于高性能查询来说是必不可少的。但是还需要合理的设计查询。如果查询写的很糟糕,那么表结构再合理、索引再合适,也无法实现高性能。
因此高性能的查询依赖于这三点:查询优化、索引优化、表结构优化。
为什么查询速度会变慢
如果把查询看作是一个任务。那么它由一些列子任务组成,每个子任务都会消耗一定的时间。如果要优化查询,实际上要优化其子任务,要么消除其中一些子任务,要么减少子任务的执行次数,要么让子任务运行的更快。
查询的生命周期:从客户端,到服务器,然后再服务器上进行解析,生成执行计划,执行(包括调用存储引擎及调用后的排序、分组等数据处理),并返回结果给客户端。在完成这些任务时,查询需要在不同地方花费时间,包括网络,CPU计算,生成统计信息和执行计划、锁等待操作。
优化数据访问
查询性能低下的原因可能是以下两种:
1 应用程序可能检索了超过需要的数据(访问了太多的行或者太多的列)。
2 MySQL服务器层可能在分析大量超过需要的数据行。
请求了不需要的数据
1 应用程序中做分页查询
2 只查找确实需要的列,不用SELECT *。
3 不要做重复查询
MySQL在扫描额外的记录
在确定了查询只返回需要的数据以后,接下来应该看查询为了返回结构是否扫描了过多的数据。最简单的衡量查询开销的三个指标如下:
*响应时间
*扫描行数
*返回行数
一般MySQL使用如下三种方式应用WHERE条件,从好到坏依次是:
重构查询方式
一个复杂查询还是多个简单查询
一般情况下,能用一个查询解决的事就不要用多个查询。因为每次查询都有网络通信、查询解析和优化的过程。但是也有例外。因为MySQL从设计上让连接和断开连接都很轻量级,在返回一个小的查询结果方面很高效。
切分查询
比如需要将某张表的全部数据做DML操作,可以多次进行。防止依次锁住很多数据、占满整个事务日志、耗尽系统资源、阻塞很多小的但重要的查询。
分解关联查询
将一个关联查询分解为多个查询的优势:
*让缓存效率更高
*减少锁的竞争
*便于对数据库进行拆分
*查询本身效率可能会有所提高,如用in()代替关联查询,可以让MySQL按照ID顺序查询,这可能比随机的关联要更高效。
可以减少冗余记录的查询。应用层做关联查询,意味着对于某条记录应用只需要查询一次,而在数据库中做关联查询,则可能需要重复的访问一部分数据。
查询执行的基础
MySQL执行一个查询的过程,到底做了些什么: