mysql-排序过程

order by

sql

#city为索引
select city,name,age from zx where city='杭州' order by name limit 1000

sort_buffer

Mysql进行排序的时候会分配每个线程分配一块内存用于排序

全字段排序

过程

1.首先会根据要查找的字段初始化sort_buffer，放入city,name,age字段
2.然后根据city索引找到所有满足city=‘杭州'的数据
3.然后根据之前的查询结果，根据主键id取出需要的数据存入sort_buffer里面
4.对sort_buffer中的数据按字段名name进行快速排序
5.最后取前1000条返回结果集

分析

从查询流程中我们知道，真正排序的过程其实就是第4步
第4步，其实还涉及到内存和的问题
#sort_buffer_size,就是MySQL为排序开辟的内存
1.如果数据量不大，可以用sort_buffer完全存下，那么排序都在内存中进行

2.如果数据量太大，sort_buffer存不下，就会利用磁盘的临时文件辅助排序

rowid排序

这个排序是专门针对单行数据很大的情况的

max_length_for_sort_data

排序单行数据最大长度，如果超过这个最大长度就会选用rowid进行排序

过程

1.初始化sort_buffer,放入主键id和需要排序的字段
2.按照索引city，把满足条件主键id取得
3.更具主键id取出整行数据，把id和name存入sort_buffer
4.对sort_buffer里面的数据按照name排序
5.最后根据排序结果，取出前1000行，并按照id取出city，name，age三个字段返回客户端

全字段 VS rowid

其实观察rowid的排序过程，我们可以轻易的发现，数据查询的过程变的更麻烦了，但是排序都是在内存中进行的，这就是它的主要目的，如果涉及到磁盘的读写，效率损失的就更厉害了

MySQL的设计思想

如果内存够用，就要多利用内存，尽量减少磁盘的访问

为啥要排序？

这就是排序的核心问题，因为查询出来的数据是无序的，所以我们要对数据排序，所以如果我们实现查询出来的数据就有序的话，可以直接避免上述的排序过程，这样的效率才是最高的

但是涉及到数据有序问题，那不避免的就是索引问题，索引也是需要成本的，所以这又是一场效率和成本的权衡问题，要对特定的问题，具体分析

关于索引，可以使用联合索引或者覆盖索引等办法

参考链接

https://time.geekbang.org/column/article/73479

秒客网