单表访问
查询方式
MySQL查询的执行方式大致分为下边两种:
-
使用全表扫描进行查询
这种执行方式很好理解,就是把表的每一行记录都扫一遍嘛,把符合搜索条件的记录加入到结果集就完了。不管是啥查询都可以使用这种方式执行,当然,这种也是最笨的执行方式。
-
使用索引进行查询
因为直接使用全表扫描的方式执行查询要遍历好多记录,所以代价可能太大了。如果查询语句中的搜索条件可以使用到某个索引,那直接使用索引来执行查询可能会加快查询执行的时间。使用索引来执行查询的方式五花八门,又可以细分为许多种类:
- 针对主键或唯一二级索引的等值查询
- 针对普通二级索引的等值查询
- 针对索引列的范围查询
- 直接扫描整个索引
设计MySQL
的大叔把MySQL
执行查询语句的方式称之为访问方法
或者访问类型
。下边细细道来各种访问方法
的具体内容。
先创建一个表
CREATE TABLE single_table (
id INT NOT NULL AUTO_INCREMENT,
key1 VARCHAR(100),
key2 INT,
key3 VARCHAR(100),
key_part1 VARCHAR(100),
key_part2 VARCHAR(100),
key_part3 VARCHAR(100),
common_field VARCHAR(100),
PRIMARY KEY (id), -- 主键
KEY idx_key1 (key1), -- 二级索引
UNIQUE KEY idx_key2 (key2), -- 唯一二级索引
KEY idx_key3 (key3),-- 二级索引
KEY idx_key_part(key_part1, key_part2, key_part3) -- 二级联合索引
) Engine=InnoDB CHARSET=utf8;
const
执行主键查询和唯一索引查询使用(查询过程是等值查询,不会出现范围查询)
SELECT * FROM single_table WHERE id = 1438;
SELECT * FROM single_table WHERE key2 = 3841;
ref
根据索引查询时,只有叶节点查询结果是连续的
SELECT * FROM single_table WHERE key_part1 = 'god like';
SELECT * FROM single_table WHERE key_part1 = 'god like' AND key_part2 = 'legendary';
SELECT * FROM single_table WHERE key_part1 = 'god like' AND key_part2 = 'legendary' AND key_part3 = 'penta kill';
SELECT * FROM single_table WHERE key2 IS NULL;
range
根据索引查询时,非叶节点和叶节点查询结果是有范围的
SELECT * FROM single_table WHERE key2 IN (1438, 6328) OR (key2 >= 38 AND key2 <= 79);
index
遍历二级索引
-- (key_part1, key_part2, key_part3)组成联合索引
SELECT key_part1, key_part2, key_part3 FROM single_table WHERE key_part2 = 'abc';
all
全表扫描
索引合并
我们前边说过MySQL
在一般情况下执行一个查询时最多只会用到单个二级索引,但不是还有特殊情况么,在这些特殊情况下也可能在一个查询中使用到多个二级索引,设计MySQL
的大叔把这种使用到多个索引来完成一次查询的执行方法称之为:index merge
,具体的索引合并算法有下边三种。
合并的前提是索引返回的主键值是有序的
Intersection合并
Intersection为交集
-- 二级索引key1返回的是key1值为'a'的主键值,在B+树中相同索引的排序方式是按主键大小排序,所以二级索引key1返回的主键是有序的,key3同理
SELECT * FROM single_table WHERE key1 = 'a' AND key3 = 'b';
SELECT * FROM single_table WHERE key1 = 'a' AND (key_part1 = 'a' AND key_part2 = 'b' AND key_part3 = 'c');
SELECT * FROM single_table WHERE id > 100 AND key1 = 'a';
合并过程就是归并排序
不能进行合并
-- 这种情况key1返回的值是无序的
SELECT * FROM single_table WHERE key1 > 'a' AND key_part1 = 'a' AND key_part2 = 'b' AND key_part3 = 'c';
-- 联合索引返回的值也是无序的
SELECT * FROM single_table WHERE key1 = 'a' AND key_part1 = 'a';
Union合并
交集
-- 前提也是返回主键有序
SELECT * FROM single_table WHERE key1 = 'a' OR key3 = 'b'
SELECT * FROM single_table WHERE key1 = 'a' OR ( key_part1 = 'a' AND key_part2 = 'b' AND key_part3 = 'c');
不能的情况
SELECT * FROM single_table WHERE key1 > 'a' OR (key_part1 = 'a' AND key_part2 = 'b' AND key_part3 = 'c');
SELECT * FROM single_table WHERE key1 = 'a' OR key_part1 = 'a';
Sort-Union合并
Union
索引合并的使用条件太苛刻,必须保证各个二级索引列在进行等值匹配的条件下才可能被用到,比方说下边这个查询就无法使用到Union
索引合并:
SELECT * FROM single_table WHERE key1 < 'a' OR key3 > 'z'
这是因为根据key1 < 'a'
从idx_key1
索引中获取的二级索引记录的主键值不是排好序的,根据key3 > 'z'
从idx_key3
索引中获取的二级索引记录的主键值也不是排好序的,但是key1 < 'a'
和key3 > 'z'
这两个条件又特别让我们动心,所以我们可以这样:
- 先根据
key1 < 'a'
条件从idx_key1
二级索引中获取记录,并按照记录的主键值进行排序 - 再根据
key3 > 'z'
条件从idx_key3
二级索引中获取记录,并按照记录的主键值进行排序 - 因为上述的两个二级索引主键值都是排好序的,剩下的操作和
Union
索引合并方式就一样了。
并多了一步对二级索引记录的主键值排序的过程。
小贴士:
为啥有Sort-Union索引合并,就没有Sort-Intersection索引合并么?因为并集是两个子集的排序结果,排序前合并还是排序后合并都是一样的,但交集却会舍去一些元素,所以会影响效率
剩下的操作和Union
索引合并方式就一样了。
并多了一步对二级索引记录的主键值排序的过程。
小贴士:
为啥有Sort-Union索引合并,就没有Sort-Intersection索引合并么?因为并集是两个子集的排序结果,排序前合并还是排序后合并都是一样的,但交集却会舍去一些元素,所以会影响效率