数据库的联合索引

时间:2024-03-31 18:44:08

今天简单总结下联合索引相关的知识!
数据库表T有A,B,C三个字段,对其建立联合索引uniq(A,B,C),请问如下查询哪些会用到索引? 
1. SELECT * FROM T WHERE A=a AND B=b AND C=c; 
2. SELECT * FROM T WHERE A=a AND B=b; 
3. SELECT * FROM T WHERE A=a AND C=c; 
4. SELECT * FROM T WHERE B=b AND C=c;

大家都知道联合索引有最左原则。也就是说,如果联合索引的第一个列没有在WHERE语句中,或者所查询的列其中并没有在索引中被建立。那么,这个联合索引是无效的。 
比如,上面的问题,这个索引可以被用于搜索如下所示的数据列组合: 
A,B,C 
A,B 
A

MySQL不能利用这个索引来搜索没有包含在最左前缀的内容。例如,如果你按照B或C来搜索,就不会使用到这个索引。 
如果你搜索给定的A和C的组合,该索引也是不能用于这种组合值的,尽管MySQL可以利用索引来查找匹配的A从而缩小搜索的范围。

那么,为什么是最左原则呢? 
就要想想联合查询的结构是怎样的。

首先,先看看B+树的结构图。 
 数据库的联合索引

那联合索引呢? 
这是一张表格,col1 是主建,col2和col3 是普通字段。 
 数据库的联合索引
那么,多列的索引是这样的 
 数据库的联合索引
也就是说,联合索引(col1, col2, col3)也是一棵B+树,其非叶子节点存储的是第一个关键字的索引,而叶子节点存储的则是三个关键字col1、col2、col3三个关键字的数据,且按照col1-col2-col3的顺序进行排序。

索引还可以这么画。 
 数据库的联合索引
如果执行的是,SELECT * FROM T WHERE B=‘Tom’ AND C=4567; 
那么无法使用索引,因为索引是用A字段先排序的,如果没有先确定A,直接查找B和C,那么将会是全表查询。

如果执行的是,SELECT * FROM T WHERE A=‘30’ AND B=Demi; 
那么,会先找到A字段,再在A等于30的数据中(比如有很多条),找B等于Demi的数据。这样是可以用到索引的。

如果执行的是,SELECT * FROM T WHERE A=‘18’ AND C=1234; 
那么,A字段可以索引,而C不能索引。所以可以部分索引,也比全表查询快。

现在,大概了解了什么为什么是最左原则。因为,B+树是按照最左边的字段以此构建的。