mysql索引&实现原理

时间:2021-08-26 02:10:17


索引是什么:是一个排序的列表,存储索引字段的值和这个数据对应的物理地址,使用索引字段查询时,不用扫描全表匹配,直接通过索引表找到改行数据对应的物理地址,然后找到对应的数据;

优点:因索引采用B 数的实现,减少I/O操作次数,增加查询效率

缺点:需要额外的硬盘空间,增、删、改有额外操作

分类:
  1. 主键索引,即主键
  2. 唯一索引,字段设置唯一约束时就已经存在,或者 alter table table_name add unique index_name("column");
  3. 一般索引,表中普通的字段作为索引:  alter table table_name add index index_name("column");
  4. 组合索引:
    1. 多个字段组合作为索引: alter table table_name add index index_name("columnA","columnB","columnC");
    2. 或者多个字段的前几个字符作为索引: alter table table_name add index index_name("columnA(3)","columnB(4)","columnC(5)"); //三个字段的前3,4,5个字符作为索引
    3. 遵循“最左前缀”,按照检索字段使用的频率排序,频率高的放左面;直接使用columnB,columnC起不到索引的作用
  5. 全文索引:
    1. 创建:alter table table_name add fulltext index index_name("column");
    2. 查询:select * from table match(index_name) against("xxx");

数据结构:

        mysql索引&实现原理

    SELECT * FROM tab WHERE index_column="中国";  index_column的数据就是存在绿色索引域中的,数字,字符串都可以,data就是对应的那行数据。

    

索引域:图中的Px

为什么采用B 树(个人理解)

  • 相对于二叉树:二叉树每个节点最多有两个子节点,B类树单个节点可容纳很多关键字,同时有很多子节点,降低了树高,判断/IO读取次数大大减少(不好理解,索引数据本身也在硬盘上)
  • 相对于B-数:B 数的非子节点只存索引,不存数据,仅仅读取索引而不是直接的数据,消耗IO较少;B 树非子节点的关键字数和子节点指针数相等,相同数据量的情况下,B 数的书高更矮,减少IO

B-树:       

        mysql索引&实现原理