SQL 关于apply的两种形式cross apply 和 outer apply， with cube 、with rollup 和 grouping

1). apply有两种形式： cross apply 和 outer apply
先看看语法：
　　<left_table_expression> {cross|outer} apply <right_table_expression>
再让我们了解一下apply运算涉及的两个步骤：
1. A1:把右表表达式(<right_table_expression>)应用到左表(<left_table_expression>)输入的行；
2. A2:添加外部行；
　　使用apply就像是先计算左输入，让后为左输入中的每一行计算一次右输入。（这一句很重要，可能会不理解，但要先记住，后面会有详细的说明）
最后结合以上两个步骤说明cross apply和outer apply的区别：
　　cross apply和outer apply 总是包含步骤A1，只有outer apply包含步骤A2，如果cross apply左行应用右表表达式时返回空积，则不返回该行。而outer apply返回改行，并且改行的右表表达式的属性为null。
看到上面的解释或步骤大家可能还是一头的雾水，不知所云。下面用例子来说明：
先建表一（[dbo].[Customers] 字段说明：customerid -- 消费者id ， city -- 所在城市）：

CREATE TABLE [dbo].[Customers](
[customerid] [char](5) NOT NULL,
[city] [varchar](10) NOT NULL,
PRIMARY KEY CLUSTERED
(
[customerid] ASC
)WITH (IGNORE_DUP_KEY = OFF) ON [PRIMARY]
) ON [PRIMARY]

向表一插入数据：
insert into dbo.Customers values('FISSA','Madrid');
insert into dbo.Customers values('FRNDO','Madrid');
insert into dbo.Customers values('KRLOS','Madrid');
insert into dbo.Customers values('MRPHS','Zion');
查询所插入的数据：
select * from dbo.Customers
结果如图：

再建表二（[dbo].[Orders] 字段说明：orderid -- 订单id ， customerid -- 消费者id）：
CREATE TABLE [dbo].[Orders](
[orderid] [int] NOT NULL,
[customerid] [char](5) COLLATE Chinese_PRC_CI_AS NULL,
PRIMARY KEY CLUSTERED
(
[orderid] ASC
)WITH (IGNORE_DUP_KEY = OFF) ON [PRIMARY]
) ON [PRIMARY]
向表二插入数据：
insert into dbo.Orders values(1,'FRNDO');
insert into dbo.Orders values(2,'FRNDO');
insert into dbo.Orders values(3,'KRLOS');
insert into dbo.Orders values(4,'KRLOS');
insert into dbo.Orders values(5,'KRLOS');
insert into dbo.Orders values(6,'MRPHS');
insert into dbo.Orders values(7,null);
查询插入的数据：
select * from dbo.orders
结果如图：

SQL 关于apply的两种形式cross apply 和 outer apply， with cube 、with rollup 和 grouping

例子：题目：得到每个消费者最新的两个订单：
用cross apply
sql：
select *
from dbo.Customers as C
cross apply
(select top 2 *
from dbo.Orders as O
where C.customerid=O.customerid
order by orderid desc) as CA
结果如图：

SQL 关于apply的两种形式cross apply 和 outer apply， with cube 、with rollup 和 grouping

过程分析：
　　它是先得出左表【dbo.Customers】里的数据，然后把此数据一条一条的放入右表表式中，分别得出结果集，最后把结果集整合到一起就是最终的返回结果集了（T1的数据像for循环一样一条一条的进入到T2中然后返回一个集合最后把所有的集合整合到一块就是最终的结果），最后我们再理解一下上面让记着的话（使用apply就像是先计算左输入，让后为左输入中的每一行计算一次右输入）是不是有所明白了。
实验：用outer apply 试试看看的到的结果：
sql语句：
select *
from dbo.Customers as C
outer apply
(select top 2 *
from dbo.Orders as O
where C.customerid=O.customerid
order by orderid desc) as CA

结果如图：

SQL 关于apply的两种形式cross apply 和 outer apply， with cube 、with rollup 和 grouping

结果分析：
　　发现outer apply得到的结果比cross多了一行，我们结合上面所写的区别（cross apply和outer apply 总是包含步骤A1，只有outer apply包含步骤A2，如果cross apply左行应用右表表达式时返回空积，则不返回该行。而outer apply返回改行，并且改行的右表表达式的属性为null）就会知道了。

2). 通过查看sql 2008的帮助文档找到了CUBE 和 ROLLUP 之间的具体区别：
1. CUBE 生成的结果集显示了所选列中值的所有组合的聚合。
2. ROLLUP 生成的结果集显示了所选列中值的某一层次结构的聚合。
再看看对grouping的解释：
　　当行由 CUBE 或 ROLLUP 运算符添加时，该函数将导致附加列的输出值为 1；当行不由 CUBE 或 ROLLUP 运算符添加时，该函数将导致附加列的输出值为 0。
仅在与包含 CUBE 或 ROLLUP 运算符的 GROUP BY 子句相关联的选择列表中才允许分组。
当看到以上的解释肯定非常的模糊，不知所云和不知道该怎样用，下面通过实例操作来体验一下：
先建表（dbo.PeopleInfo）：
CREATE TABLE [dbo].[PeopleInfo](
[id] [int] IDENTITY(1,1) NOT NULL,
[name] [nchar](10) COLLATE Chinese_PRC_CI_AS NULL,
[numb] [nchar](10) COLLATE Chinese_PRC_CI_AS NOT NULL,
[phone] [nchar](10) COLLATE Chinese_PRC_CI_AS NULL,
[FenShu] [int] NULL
) ON [PRIMARY]

向表插入数据：
insert into peopleinfo([name],numb,phone,fenshu) values ('李欢','3223','1365255',80)
insert into peopleinfo([name],numb,phone,fenshu) values ('李欢','322123','1',90)
insert into peopleinfo([name],numb,phone,fenshu) values ('李名','3213112352','13152',56)
insert into peopleinfo([name],numb,phone,fenshu) values ('李名','32132312','13342563',60)
insert into peopleinfo([name],numb,phone,fenshu) values ('王华','3223','1365255',80)
查询出插入的全部数据：
select * from dbo.PeopleInfo
结果如图：

SQL 关于apply的两种形式cross apply 和 outer apply， with cube 、with rollup 和 grouping

操作一：先试试：1, 查询所有数据；2,用group by 查询所有数据；3,用with cube。这三种情况的比较
SQL语句如下：
select * from dbo.PeopleInfo --1, 查询所有数据；

select [name],numb,sum(fenshu) from dbo.PeopleInfo group by [name],numb --2,用group by 查询所有数据；

select [name],numb,sum(fenshu) from dbo.PeopleInfo group by [name],numb with cube --3,用with cube。这三种情况的比较
结果如图：

SQL 关于apply的两种形式cross apply 和 outer apply， with cube 、with rollup 和 grouping

结果分析：
　　用第三种(用with cube)为什么会多出来有null的字段值呢？通过分析图上的值得组合会发现是怎么回事儿了，以第三条数据（李欢，null，170）为例：它只是把姓名是【李欢】的分为了一组，而没有考虑【numb】，所以有多出来了第三条数据，也说明了170是怎么来的。其他的也是这样。再回顾一下帮助文档的解释：CUBE 生成的结果集显示了所选列中值的所有组合的聚合，发现明了了许多。

操作二：1,用with cube；2,用with rollup 这两种情况的比较
SQL语句如下：
select [name],numb,sum(fenshu) from dbo.PeopleInfo group by [name],numb with cube --用with cube。

select [name],numb,sum(fenshu) from dbo.PeopleInfo group by [name],numb with rollup --用with rollup。
结果如图：

SQL 关于apply的两种形式cross apply 和 outer apply， with cube 、with rollup 和 grouping

结果分析：
　　为什么with cube 比 with rollup多出来一部分呢？原来它没有显示，以【numb】分组而不考虑【name】的数据情况。再回顾一下帮助文档的解释：ROLLUP 生成的结果集显示了所选列中值的某一层次结构的聚合，那这个【某一层次】又是以什么为标准的呢？我的猜想是：距离group up最近的字段必须考虑在分组内。
证明猜想实例：
操作：用两个group up 交换字段位置的sql语句和一个在group up 后面增加一个字段的sql语句进行比较：
SQL语句如下：

select [name],numb from dbo.PeopleInfo group by [name],numb with rollup

select [name],numb from dbo.PeopleInfo group by numb,[name] with rollup

select [name],numb,phone from dbo.PeopleInfo group by [name],numb,phone with rollup

结果如图：

SQL 关于apply的两种形式cross apply 和 outer apply， with cube 、with rollup 和 grouping

通过结果图的比较发现猜想是正确的。

现在来看看grouping的实例：
SQL语句看看与with rollup的结合（与with cube的结合是一样的）：
select [name],numb,grouping(numb) from dbo.PeopleInfo group by [name],numb with rollup
结果如图：

SQL 关于apply的两种形式cross apply 和 outer apply， with cube 、with rollup 和 grouping

结果分析：
　　结合帮助文档的解释：当行由 CUBE 或 ROLLUP 运算符添加时，该函数将导致附加列的输出值为 1；当行不由 CUBE 或 ROLLUP 运算符添加时，该函数将导致附加列的输出值为 0。很容易理解再此就不多解释了。

秒客网

SQL 关于apply的两种形式cross apply 和 outer apply， with cube 、with rollup 和 grouping

相关文章