学习如何看懂SQL Server执行计划（二）——函数计算篇

二、函数计算部分

--------------------标量聚合--------------------
/*

标量聚合-主要在聚合函数操作中产生

计算标量：根据行中的现有值计算出一个新值

流聚合：在相应排序的流中，计算多组行的汇总值

所有的聚合函数都会有流聚合出现，但是其不会消耗IO，只消耗CPU

除MAX()和MIN()外其他聚合函数都会同时出现标量和聚合两个操作

当列列表只包含聚合函数时，则结果集只具有一个行给出的聚合值，

该值由与WHERE子句相匹配的源行计算得到。

*/

SELECT MAX(Age) FROM dbo.UserInfo

SELECT COUNT(*) FROM dbo.UserInfo

/*

执行以下语句，你会发现对[Id]进行去重由于是主键不会有重复，所以直接

通过流聚合就可以计算出结果，而[Name]字段进行去重的时候会有一个Sort排序的操作，

排序是比较消耗资源的尤其在数据量较大的表中，所以我们可以针对这个进行一下优化

*/

SELECT COUNT(DISTINCT Id) FROM dbo.UserInfo

SELECT COUNT(DISTINCT Name) FROM dbo.UserInfo

学习如何看懂SQL Server执行计划（二）——函数计算篇

/*

为[Name]字段建立一个非聚集索引再执行一下，会发现出现两个流聚合却没有了排序，

这样就节省了排序的开销，标量聚合算法比较简单，适合非重复值的聚合操作，调优时

尽量避免排序的产生，将分组(GROUP BY)字段锁定在索引覆盖范围内

*/

DROP INDEX dbo.UserInfo.Index_UserInfo_Name

CREATE INDEX Index_UserInfo_Name ON dbo.UserInfo(Name)

学习如何看懂SQL Server执行计划（二）——函数计算篇

--------------------散列聚合（哈希匹配）--------------------/*

散列聚合(哈希匹配)-为了解决流聚合的不足,应对大数据的操作而产生的

对于数据量比较大时，SQL Server选择的是哈希匹配。

在内存中建立好散列表后，会按照GROUP BY后面的值作为键，

然后依次处理集合中的每条数据，当键在散列表中不存在时，

向散列表添加条目，当键已经在散列表中存在时，按照规则

聚合函数计算散列表中的值

*/

SELECT Name,COUNT(*) FROM dbo.UserInfo

GROUP BY Name

SELECT [Type],COUNT(*) FROM dbo.UserInfo

GROUP BY [Type]

学习如何看懂SQL Server执行计划（二）——函数计算篇

--------------------排序--------------------/*

排序-资源消耗较高的操作

对于数据量比较小时，执行GROUP BY操作会使用SORT

注意：Sort操作是占用内存的操作，当内存不足时会占用Tempdb

(SQL Server总是会在Sort操作和散列匹配中选择成本最低的)

调优时为排序字段建立索引可以更好的提高查询效率，如果想

按照添加时间倒序，那么Order By Id(Identity)可以达到同样的

结果，而且效率还更高

*/

SELECT * FROM dbo.UserInfo

ORDER BY AddTime

SELECT * FROM dbo.UserInfo

ORDER BY Id

学习如何看懂SQL Server执行计划（二）——函数计算篇

--------------------查看查询IO、时间、内存占用--------------------/*

使用SET STATISTICS IO, TIME还有其他的监控元素可以查看到当前

执行的SQL性能，有针对性的进行调优操作

选中表按Alt+F1可以显示选中表的结构，包括列、主键、索引等

执行SQL语句使用Ctrl+M可以显示当前SQL的执行计划，便于调试

dbo是SQL Server的架构名，默认就是dbo，除非强制将函数等写在其他架构名

下才无法调用

*/

SET STATISTICS IO, TIME ON

SELECT * FROM dbo.UserInfo

SET STATISTICS IO, TIME OFF

学习如何看懂SQL Server执行计划（二）——函数计算篇

秒客网

学习如何看懂SQL Server执行计划（二）——函数计算篇

相关文章