在今天的文章里，我想谈下SQL Server里一个非常有趣的话题：在表联接里，把表指定顺序的话是否有意义？每次我进行查询和性能调优的展示时，大家都会问我他们是否应该把联接中的表指定下顺序，是否会帮助查询优化器得出一个更好性能的执行计划。我们来看下这个重要又有趣的问题。

合并联接（Inner Joins）

假设在AdventureWorks数据库里，你要在Sales.SalesOrderHeader表和Sales.SalesOrderDetail表之间做一个内联接：

 USE AdventureWorks

 GO

 -- Returns for each SalesOrderHeader record all associated SalesOrderDetail records

 -- SQL Server performs a Merge Join, because both tables are phyiscally sorted

 -- by the column "SalesOrderID".

 SELECT

     h.SalesOrderID,

     h.CustomerID,

     d.SalesOrderDetailID,

     d.ProductID,

     d.LineTotal

 FROM Sales.SalesOrderHeader h

 JOIN Sales.SalesOrderDetail d

 ON h.SalesOrderID = d.SalesOrderID

 ORDER BY SalesOrderID

 GO

当我们查看结果的执行计划时，我们可以看到查询优化器选择了合并联接（Inner Join）作为物理联接运算符，Sales.SalesOrderHeader表作为合并联接的外联接。在执行计划里表的顺序和我们在逻辑T-SQL查询里的顺序是一样的。

Join的表顺序

现在的问题是，当我们在逻辑T-SQL查询里交换下2个表的顺序，执行计划会发生什么？我们来试下：

 -- The logical ordering of the tables during an Inner Join

 -- doesn't matter. It's up to the Query Optimnizer to arrange

 -- the tables in the best order.

 -- This query produces the same execution plan as the previous one.

 SELECT

     h.SalesOrderID,

     h.CustomerID,

     d.SalesOrderDetailID,

     d.ProductID,

     d.LineTotal

 FROM Sales.SalesOrderDetail d

 JOIN Sales.SalesOrderHeader h

 ON d.SalesOrderID = h.SalesOrderID

 ORDER BY SalesOrderID

 GO

但我们现在看结果的执行计划，我们发现很有意思：

Join的表顺序

在执行计划里没有任何改变！查询优化器选择了和刚才查询一样的物理执行计划。但为什么？答案非常简单：查询优化器总引用最小的表（基于我们的统计信息！）作为每个物理连接运算符（嵌套循环联接，合并联接，哈希匹配联接）的外联接表。因此在T-SQL查询里的表的逻辑顺序不会对查询优化器造成任何影响。按正确的顺序访问我们的表是查询优化器的职责。

在表A和表B之间的合并联接与表B和表A之间的合并联接是一样的。

Join的表顺序

外联接（Outer Join）

在外联接（left join，right join）里，表顺序会有啥影响？我们来看下面的查询，在Sales.Customer表和 Sales.SalesOrderHeader表之间进行左联接。

 -- Execute the query with an Outer Join.

 -- Now we are also getting back customers that haven't placed orders.

 -- The left table is the preserving one, and missing rows from the right table are added with NULL values.

 -- SQL Server performs a "Merge Join (Left Outer Join)" in the execution plan.

 SELECT

     c.CustomerID,

     h.SalesOrderID

 FROM Sales.Customer c

 LEFT JOIN Sales.SalesOrderHeader h

 ON c.CustomerID = h.CustomerID

 GO

当我们查看结果执行计划时，我们会看到查询优化器已经隐藏了我们的表顺序。

Join的表顺序

当然这次我们不能修改T-SQL语句里的表顺序，不然查询会返回错误的结果。但当我们在查询里切换下表会发生什么，不是左联接，我们用右联接。我们来试下：

 -- You can rewrite the query from above with a Right Outer Join when you swap the order

 -- of the tables. This time you get back the same result (32166 rows).

 SELECT

     c.CustomerID,

     h.SalesOrderID

 FROM Sales.SalesOrderHeader h

 RIGHT JOIN Sales.Customer c

 ON c.CustomerID = h.CustomerID

 GO

Join的表顺序

当我们看执行计划时，我们再次看到没有任何改变：查询优化器转化右联接为左联接，重排了下表还是返回正确的结果。查询优化器的目标是使用最小表作为物理联接运算符的外表。因此在外联接里表的顺序也不会影响查询优化器。只要我们的统计信息是正确的，查询优化器总会选择正确的顺序。

在表A和表B之间的左联接与表B和表A之间的右联接是一样的。

Join的表顺序

小结：

在这篇文章里我们讨论对于联接，表的顺序是否会影响执行计划。如我们所见，这完全由查询优化器来决定选择优化的表顺序——基于统计信息。在合并联接里表顺序完全不影响，使用外联接的话，SQL Server可以通过切换左联接/右联接来重排表，还是获得正确的结果。

参考文章：

http://www.sqlpassion.at/archive/2015/12/15/table-ordering-for-joins/

Join的表顺序的更多相关文章

JOIN关联表中ON,WHERE后面跟条件的区别
select * from td left join (select case_id as sup_case_id , count(*) supervise_number from td_kcdc ...
join多表连接和group by分组
join多表连接和group by分组上一篇里面我们实现了单表查询和top N查询,这一篇我们来讲述如何实现多表连接和group by分组. 一.多表连接多表连接的时间是数据库一个非常耗时的操作, ...
【Spark调优】大表join大表，少数key导致数据倾斜解决方案
[使用场景] 两个RDD进行join的时候,如果数据量都比较大,那么此时可以sample看下两个RDD中的key分布情况.如果出现数据倾斜,是因为其中某一个RDD中的少数几个key的数据量过大,而另一 ...
MySQL JOIN 多表连接
除了常用的两个表连接之外,SQL(MySQL) JOIN 语法还支持多表连接.多表连接基本语法如下: 1 ... FROM table1 INNER|LEFT|RIGHT JOIN table2 ON ...
对于大量left join 的表查询，可以在关键的连接节点字段上创建索引。
对于大量left join 的表查询,可以在关键的连接节点字段上创建索引. 问题: 大量的left join 怎么优化 select a.id,a.num,b.num,b.pcs,c.num, c. ...
left join 连表时，on后多条件无效问题
http://www.cnblogs.com/guixiaoming/p/6516261.html left join 连表时,on后多条件无效问题最近开发素材库项目,各种关系复杂的表,一度6张表的 ...
【Spark调优】小表join大表数据倾斜解决方案
[使用场景] 对RDD使用join类操作,或者是在Spark SQL中使用join语句时,而且join操作中的一个RDD或表的数据量比较小(例如几百MB或者1~2GB),比较适用此方案. [解决方案] ...
mybatis逆向工程，实现join多表查询，避免多表相同字段名的陷阱
mybatis逆向工程,实现join多表查询,避免多表相同字段名的陷阱前言:使用 mybatis generator 生成表格对应的pojo.dao.mapper,以及对应的example的 ...
大数据开发实战：Hive优化实战3-大表join大表优化
5.大表join大表优化如果Hive优化实战2中mapjoin中小表dim_seller很大呢?比如超过了1GB大小?这种就是大表join大表的问题.首先引入一个具体的问题场景,然后基于此介绍各自优 ...

随机推荐

Find Out What Your Entity Framework Query Is Really Doing
Assuming that you're using Entity Framework 6, you already have a logging tool that can give you som ...
Memcached源码分析——process&lowbar;command函数解析
以下为个人笔记 /** * process_command 在memcached中是用来处理用户发送的命令的, * 包括get set,add,delete,replace,stats,flush_a ...
MySQL 操作详解
MySQL 操作详解一.实验简介本节实验中学习并实践 MySQL 上创建数据库.创建表.查找信息等详细的语法及参数使用方法. 二.创建并使用数据库 1. 创建并选择数据库使用SHOW语句找出服务 ...
CentOS7像外部163邮箱发送邮件
我们在运维过程中,为了随时了解服务器的工作状态,出现问题随时提醒,像个人邮箱发送邮件是必须的,但是刚刚安装好的系统是无法发送邮件的.需要们进行一些配置和程序的安装,我安装完系统后,自带mail12.5 ...
Python&lowbar;day8
多态 class Animal(object): def run(self): print('animal is running') class Dog(Animal): def run(self): ...
python之获取当前操作系统(平台)
Python在不同环境平台使用时,需要判断当前是什么系统,比如常用的windows,linux等下面介绍一些能够获取当前系统的命令 1.使用sys.platform获取 #!/usr/bin/env ...
python dash 初探 --- k 线国内版
python dash 的应用首页,是用一个 k 线图来做 damo 的,奈何数据源用的 Google,上不去.当然,可以换 yahoo,但是毕竟国内的还是更亲切些. 官方的 demo 用的 pand ...
HTML|CSS之HTML常用标签
知识内容: 1.标签 2.head内标签 3.body内常用标签注:本人使用的HTML为HTML5 一.标签 1.标签格式标签的语法: <标签名属性1=“属性值1” 属性2=“属性值2”… ...
GNU构建系统和Autotool
原文:http://os.51cto.com/art/201609/518191.htm 经常使用Linux的开发人员或者运维人员,可能对configure->make->make ins ...
【转】线程间操作无效&colon; 从不是创建控件&OpenCurlyDoubleQuote;textBox2” 的线程访问它。
using System;using System.Collections.Generic;using System.ComponentModel;using System.Data;using Sy ...