二、函数计算部分
--------------------标量聚合--------------------
/*
标量聚合-主要在聚合函数操作中产生
计算标量:根据行中的现有值计算出一个新值
流聚合:在相应排序的流中,计算多组行的汇总值
所有的聚合函数都会有流聚合出现,但是其不会消耗IO,只消耗CPU
除MAX()和MIN()外其他聚合函数都会同时出现标量和聚合两个操作
当列列表只包含聚合函数时,则结果集只具有一个行给出的聚合值,
该值由与WHERE子句相匹配的源行计算得到。
*/
SELECT MAX(Age) FROM dbo.UserInfo
SELECT COUNT(*) FROM dbo.UserInfo
/*
执行以下语句,你会发现对[Id]进行去重由于是主键不会有重复,所以直接
通过流聚合就可以计算出结果,而[Name]字段进行去重的时候会有一个Sort排序的操作,
排序是比较消耗资源的尤其在数据量较大的表中,所以我们可以针对这个进行一下优化
*/
SELECT COUNT(DISTINCT Id) FROM dbo.UserInfo
SELECT COUNT(DISTINCT Name) FROM dbo.UserInfo
/*
为[Name]字段建立一个非聚集索引再执行一下,会发现出现两个流聚合却没有了排序,
这样就节省了排序的开销,标量聚合算法比较简单,适合非重复值的聚合操作,调优时
尽量避免排序的产生,将分组(GROUP BY)字段锁定在索引覆盖范围内
*/
DROP INDEX dbo.UserInfo.Index_UserInfo_Name
CREATE INDEX Index_UserInfo_Name ON dbo.UserInfo(Name)
--------------------散列聚合(哈希匹配)--------------------/*
散列聚合(哈希匹配)-为了解决流聚合的不足,应对大数据的操作而产生的
对于数据量比较大时,SQL Server选择的是哈希匹配。
在内存中建立好散列表后,会按照GROUP BY后面的值作为键,
然后依次处理集合中的每条数据,当键在散列表中不存在时,
向散列表添加条目,当键已经在散列表中存在时,按照规则
聚合函数计算散列表中的值
*/
SELECT Name,COUNT(*) FROM dbo.UserInfo
GROUP BY Name
SELECT [Type],COUNT(*) FROM dbo.UserInfo
GROUP BY [Type]
--------------------排序--------------------/*
排序-资源消耗较高的操作
对于数据量比较小时,执行GROUP BY操作会使用SORT
注意:Sort操作是占用内存的操作,当内存不足时会占用Tempdb
(SQL Server总是会在Sort操作和散列匹配中选择成本最低的)
调优时为排序字段建立索引可以更好的提高查询效率,如果想
按照添加时间倒序,那么Order By Id(Identity)可以达到同样的
结果,而且效率还更高
*/
SELECT * FROM dbo.UserInfo
ORDER BY AddTime
SELECT * FROM dbo.UserInfo
ORDER BY Id
--------------------查看查询IO、时间、内存占用--------------------/*
使用SET STATISTICS IO, TIME还有其他的监控元素可以查看到当前
执行的SQL性能,有针对性的进行调优操作 选中表按Alt+F1可以显示选中表的结构,包括列、主键、索引等
执行SQL语句使用Ctrl+M可以显示当前SQL的执行计划,便于调试
dbo是SQL Server的架构名,默认就是dbo,除非强制将函数等写在其他架构名
下才无法调用
*/
SET STATISTICS IO, TIME ON
SELECT * FROM dbo.UserInfo
SET STATISTICS IO, TIME OFF