在多张表查询的时候一般我们用left join、inner join、join、right join等等一些方法实现,但是会检索表中
所有的数据,如果是数据量小的话体现不出来查询的快慢但当数据量大(2万条以上呢)
这时候查询数据连接查询就比较慢了,然后在百度上查了下说索引查询会在多表查询的时候回更快
一、什么是索引?为什么要建立索引?
索引用于快速找出在某个列中有一特定值的行,不使用索引,MySQL必须从第一条记录开始读完整个表,直到找出相关的行,表越大,查询数据所花费的时间就越多,
如果表中查询的列有一个索引,MySQL能够快速到达一个位置去搜索数据文件,而不必查看所有数据,那么将会节省很大一部分时间。
例如:有一张person表,其中有2W条记录,记录着2W个人的信息。有一个Phone的字段记录每个人的电话号码,现在想要查询出电话号码为xxxx的人的信息。
如果没有索引,那么将从表中第一条记录一条条往下遍历,直到找到该条信息为止。
如果有了索引,那么会将该Phone字段,通过一定的方法进行存储,好让查询该字段上的信息时,能够快速找到对应的数据,而不必在遍历2W条数据了。其中MySQL中的索引的存储类型有两种:BTREE、HASH。 也就是用树或者Hash值来存储该字段,要知道其中详细是如何查找的,就需要会算法的知识了。我们现在只需要知道索引的作用,功能是什么就行。
二、MySQL中索引的优点和缺点和使用原则
优点:
2、所有的MySql列类型(字段类型)都可以被索引,也就是可以给任意字段设置索引
3、大大加快数据的查询速度
缺点:
1、创建索引和维护索引要耗费时间,并且随着数据量的增加所耗费的时间也会增加
2、索引也需要占空间,我们知道数据表中的数据也会有最大上线设置的,如果我们有大量的索引,索引文件可能会比数据文件更快达到上线值
3、当对表中的数据进行增加、删除、修改时,索引也需要动态的维护,降低了数据的维护速度。
使用原则:
通过上面说的优点和缺点,我们应该可以知道,并不是每个字段度设置索引就好,也不是索引越多越好,而是需要自己合理的使用。
1、对经常更新的表就避免对其进行过多的索引,对经常用于查询的字段应该创建索引,
2、数据量小的表最好不要使用索引,因为由于数据较少,可能查询全部数据花费的时间比遍历索引的时间还要短,索引就可能不会产生优化效果。
3、在一同值少的列上(字段上)不要建立索引,比如在学生表的"性别"字段上只有男,女两个不同值。相反的,在一个字段上不同值较多可是建立索引。
上面说的只是很片面的一些东西,索引肯定还有很多别的优点或者缺点,还有使用原则,先基本上理解索引,然后等以后真正用到了,就会慢慢知道别的作用。注意,学习这张,很重要的一点就是必须先得知道索引是什么,索引是干嘛的,有什么作用,为什么要索引等等,如果不知道,就重复往上面看看写的文字,好好理解一下。一个表中很够创建多个索引,这些索引度会被存放到一个索引文件中(专门存放索引的地方)
三、索引的分类
注意:索引是在存储引擎中实现的,也就是说不同的存储引擎,会使用不同的索引
MyISAM和InnoDB存储引擎:只支持BTREE索引, 也就是说默认使用BTREE,不能够更换
MEMORY/HEAP存储引擎:支持HASH和BTREE索引
1、索引我们分为四类来讲 单列索引(普通索引,唯一索引,主键索引)、组合索引、全文索引、空间索引、
1.1、单列索引:一个索引只包含单个列,但一个表中可以有多个单列索引。 这里不要搞混淆了。
1.1.1、普通索引:
MySQL中基本索引类型,没有什么限制,允许在定义索引的列中插入重复值和空值,纯粹为了查询数据更快一点。
1.1.2、唯一索引:
索引列中的值必须是唯一的,但是允许为空值,
1.1.3、主键索引:
是一种特殊的唯一索引,不允许有空值。
1.2、组合索引
在表中的多个字段组合上创建的索引,只有在查询条件中使用了这些字段的左边字段时,索引才会被使用,
使用组合索引时遵循最左前缀集合。这个如果还不明白,等后面举例讲解时在细说
1.3、全文索引
全文索引,只有在MyISAM引擎上才能使用,只能在CHAR,VARCHAR,TEXT类型字段上使用全文索引,介绍了要求,说说什么是全文索引,就是在一堆文字中,通过其中的某个关键字等,就能找到该字段所属的记录行,比如有"你是个大煞笔,二货 ..." 通过大煞笔,可能就可以找到该条记录。这里说的是可能,因为全文索引的使用涉及了很多细节,我们只需要知道这个大概意思,如果感兴趣进一步深入使用它,那么看下面测试该索引时,会给出一个博文,供大家参考。
1.4、空间索引
空间索引是对空间数据类型的字段建立的索引,MySQL中的空间数据类型有四种,GEOMETRY、POINT、LINESTRING、POLYGON。
在创建空间索引时,使用SPATIAL关键字。
要求,引擎为MyISAM,创建空间索引的列,必须将其声明为NOT NULL。
现在看看我的情况
SELECT count( 0 ) FROM ( SELECT t.NEWS_ID, t.TYPE, n.TYPENAME, t.TITLE, t.DEPT_ID, p.CNAME, t.POPULARITY, t.CTIME, t.HIDE, i.HJMC, i.CZQX, l.NEXT_LINK, l.NOTATION, t.RECOMMEND, t.RPLACEMENT, n.AUDIT, t.STATUS FROM web_news t LEFT JOIN sys_newstype n ON t.TYPE = n.NEWSTYPE_ID LEFT JOIN tb_link l ON t.NEWS_ID = l.NEWS_ID AND l.CREAT_DATE in ( SELECT MAX( c.CREAT_DATE ) FROM tb_link c group by c.NEWS_ID ) LEFT JOIN JTJ_INFOAUDIT i ON i.INFOAUDIT_ID = l.NEXT_LINK LEFT JOIN sys_tdept p ON p.CID = t.DEPT_ID WHERE 1 = 1 AND t.STATUS IN ( \'2\', \'3\' ) AND t.CTIME >= DATE_SUB( CURDATE( ), INTERVAL dayofyear( now( ) ) - 1 DAY ) ORDER BY t.STATUS, t.CTIME DESC, t.RECOMMEND DESC ) tmp_count
在没有创建索引的时候我的sql查询是2.6秒
数据:
然后我在表tb_link、web_news表中的news_ID创建索引(因为这个id是这个查询中用的查询条数最多的)
ADD INDEX `ind_news_id1`(`link_id`);
ALTER TABLE `jtj-web1123`.`tb_link`
DROP INDEX `ind_news_id1`;
# 创建索引
ALTER TABLE `jtj-web1123`.`tb_link` ADD INDEX `ind_news_id`(`news_ID`);
ALTER TABLE `jtj-web1123`.`web_news` ADD INDEX `ind_news_id`(`news_ID`);
# 查看索引
show index from book
show index from phone
然后在去查询
完成后却用了0.387s
总结:
- 在进行多表联查时我们使用了left join
- 第一次在左边的表加了索引
- 但是没有效果
- 这是由左连接的特性决定的,left join 是明确左边表的数据肯定都有,从右边表进行查询数据
- 所以右边是关键,我们一定要加上索引
- 那么多表查询也是同样的,反正记住一点,左连接加右表,右连接加到左表
- 小表驱动大表