mysql 多表联查的快速查询(索引)

时间:2024-03-08 16:43:27

在多张表查询的时候一般我们用left join、inner join、join、right join等等一些方法实现,但是会检索表中

所有的数据,如果是数据量小的话体现不出来查询的快慢但当数据量大(2万条以上呢)

这时候查询数据连接查询就比较慢了,然后在百度上查了下说索引查询会在多表查询的时候回更快

一、什么是索引?为什么要建立索引?

索引用于快速找出在某个列中有一特定值的行,不使用索引,MySQL必须从第一条记录开始读完整个表,直到找出相关的行,表越大,查询数据所花费的时间就越多,

如果表中查询的列有一个索引,MySQL能够快速到达一个位置去搜索数据文件,而不必查看所有数据,那么将会节省很大一部分时间。

例如:有一张person表,其中有2W条记录,记录着2W个人的信息。有一个Phone的字段记录每个人的电话号码,现在想要查询出电话号码为xxxx的人的信息。

   如果没有索引,那么将从表中第一条记录一条条往下遍历,直到找到该条信息为止。

   如果有了索引,那么会将该Phone字段,通过一定的方法进行存储,好让查询该字段上的信息时,能够快速找到对应的数据,而不必在遍历2W条数据了。其中MySQL中的索引的存储类型有两种:BTREE、HASH。 也就是用树或者Hash值来存储该字段,要知道其中详细是如何查找的,就需要会算法的知识了。我们现在只需要知道索引的作用,功能是什么就行。

二、MySQL中索引的优点和缺点和使用原则

      优点:

       2、所有的MySql列类型(字段类型)都可以被索引,也就是可以给任意字段设置索引

       3、大大加快数据的查询速度

      缺点:

       1、创建索引和维护索引要耗费时间,并且随着数据量的增加所耗费的时间也会增加

       2、索引也需要占空间,我们知道数据表中的数据也会有最大上线设置的,如果我们有大量的索引,索引文件可能会比数据文件更快达到上线值

       3、当对表中的数据进行增加、删除、修改时,索引也需要动态的维护,降低了数据的维护速度。

      使用原则:

            通过上面说的优点和缺点,我们应该可以知道,并不是每个字段度设置索引就好,也不是索引越多越好,而是需要自己合理的使用。

       1、对经常更新的表就避免对其进行过多的索引,对经常用于查询的字段应该创建索引,

       2、数据量小的表最好不要使用索引,因为由于数据较少,可能查询全部数据花费的时间比遍历索引的时间还要短,索引就可能不会产生优化效果。

       3、在一同值少的列上(字段上)不要建立索引,比如在学生表的"性别"字段上只有男,女两个不同值。相反的,在一个字段上不同值较多可是建立索引。

  

  上面说的只是很片面的一些东西,索引肯定还有很多别的优点或者缺点,还有使用原则,先基本上理解索引,然后等以后真正用到了,就会慢慢知道别的作用。注意,学习这张,很重要的一点就是必须先得知道索引是什么,索引是干嘛的,有什么作用,为什么要索引等等,如果不知道,就重复往上面看看写的文字,好好理解一下。一个表中很够创建多个索引,这些索引度会被存放到一个索引文件中(专门存放索引的地方)

三、索引的分类  

 注意:索引是在存储引擎中实现的,也就是说不同的存储引擎,会使用不同的索引

    MyISAM和InnoDB存储引擎:只支持BTREE索引, 也就是说默认使用BTREE,不能够更换

    MEMORY/HEAP存储引擎:支持HASH和BTREE索引

 1、索引我们分为四类来讲 单列索引(普通索引,唯一索引,主键索引)、组合索引、全文索引、空间索引、

   1.1、单列索引:一个索引只包含单个列,但一个表中可以有多个单列索引。 这里不要搞混淆了。

   1.1.1、普通索引:

      MySQL中基本索引类型,没有什么限制,允许在定义索引的列中插入重复值和空值,纯粹为了查询数据更快一点。

   1.1.2、唯一索引:

      索引列中的值必须是唯一的,但是允许为空值,

   1.1.3、主键索引:

      是一种特殊的唯一索引,不允许有空值。

   1.2、组合索引

      在表中的多个字段组合上创建的索引,只有在查询条件中使用了这些字段的左边字段时,索引才会被使用,

      使用组合索引时遵循最左前缀集合。这个如果还不明白,等后面举例讲解时在细说 

   1.3、全文索引

      全文索引,只有在MyISAM引擎上才能使用,只能在CHAR,VARCHAR,TEXT类型字段上使用全文索引,介绍了要求,说说什么是全文索引,就是在一堆文字中,通过其中的某个关键字等,就能找到该字段所属的记录行,比如有"你是个大煞笔,二货 ..." 通过大煞笔,可能就可以找到该条记录。这里说的是可能,因为全文索引的使用涉及了很多细节,我们只需要知道这个大概意思,如果感兴趣进一步深入使用它,那么看下面测试该索引时,会给出一个博文,供大家参考。

   1.4、空间索引

     空间索引是对空间数据类型的字段建立的索引,MySQL中的空间数据类型有四种,GEOMETRY、POINT、LINESTRING、POLYGON。

     在创建空间索引时,使用SPATIAL关键字。

     要求,引擎为MyISAM,创建空间索引的列,必须将其声明为NOT NULL。

现在看看我的情况

SELECT
    count( 0 ) 
FROM
    (
SELECT
    t.NEWS_ID,
    t.TYPE,
    n.TYPENAME,
    t.TITLE,
    t.DEPT_ID,
    p.CNAME,
    t.POPULARITY,
    t.CTIME,
    t.HIDE,
    i.HJMC,
    i.CZQX,
    l.NEXT_LINK,
    l.NOTATION,
    t.RECOMMEND,
    t.RPLACEMENT,
    n.AUDIT,
    t.STATUS 
FROM
    web_news t
    LEFT JOIN sys_newstype n ON t.TYPE = n.NEWSTYPE_ID
    LEFT JOIN tb_link l ON t.NEWS_ID = l.NEWS_ID 
    AND l.CREAT_DATE in ( SELECT MAX( c.CREAT_DATE ) FROM tb_link c group by c.NEWS_ID )
    LEFT JOIN JTJ_INFOAUDIT i ON i.INFOAUDIT_ID = l.NEXT_LINK
    LEFT JOIN sys_tdept p ON p.CID = t.DEPT_ID 
WHERE
    1 = 1 
    AND t.STATUS IN ( \'2\', \'3\' ) 
    AND t.CTIME >= DATE_SUB( CURDATE( ), INTERVAL dayofyear( now( ) ) - 1 DAY ) 
ORDER BY
    t.STATUS,
    t.CTIME DESC,
    t.RECOMMEND DESC 
    ) tmp_count

在没有创建索引的时候我的sql查询是2.6秒

数据:

然后我在表tb_link、web_news表中的news_ID创建索引(因为这个id是这个查询中用的查询条数最多的)

ADD INDEX `ind_news_id1`(`link_id`);

ALTER TABLE `jtj-web1123`.`tb_link`
DROP INDEX `ind_news_id1`;

# 创建索引 
ALTER TABLE `jtj-web1123`.`tb_link` ADD INDEX `ind_news_id`(`news_ID`);
ALTER TABLE `jtj-web1123`.`web_news` ADD INDEX `ind_news_id`(`news_ID`);
# 查看索引 
show index from book
show index from phone

然后在去查询

完成后却用了0.387s

总结:

  • 在进行多表联查时我们使用了left join
  • 第一次在左边的表加了索引
  • 但是没有效果
  • 这是由左连接的特性决定的,left join 是明确左边表的数据肯定都有,从右边表进行查询数据
  • 所以右边是关键,我们一定要加上索引
  • 那么多表查询也是同样的,反正记住一点,左连接加右表,右连接加到左表
  • 小表驱动大表