翻译Stairway to T-SQL DML Level 7: Summarizing Data Using a Simple GROUP BY Clause

时间:2022-03-12 16:23:11

通往T-SQL DML Level 7的阶梯:使用简单的GROUP BY子句汇总数据

来自 Gregory Larsen, 2012/01/04

系列

这篇文章是阶梯系列的一部分:通往T-SQL DML的阶梯。

通过使用SQL ServerTransact-SQL (T-SQL)语言,这个阶梯将为您提供如何使用SQL Server表的数据的基本理解。DML是数据操纵语言,是处理数据的语言的一方面。它包括语句的选择、插入、更新和删除。这个阶梯将提供一些SQL语言的历史和一些关于集合论的一般概念。每个级别都将建立在之前的级别之上,所以当你完成时,你将对如何从SQL Server中选择和修改数据有一个很好的理解。

在阶梯6中,我向你展示了如何使用ORDER BY子句对数据进行排序,这使你可以根据单个或多个列对详细的记录进行排序。如果你想要在特定记录中查看数据,那么详细的数据是非常好的,但是有时候你需要将详细的数据汇总到汇总值中。你可以使用GROUP BY子句汇总你的数据。

GROUP BY子句有两种类型,一种被称为简单的GROUP BY子句,另一种则提供了更为简单的概括,被称为一般的GROUP BY子句。这两种类型的主要区别是简单的GROUP BY只包含GROUP BY子句,而一般的GROUP BY子句包含其他操作符,如ROLLUPCUBE

在本文中,我将介绍如何使用简单的GROUP BY子句对数据进行分组,在后一篇的文章中,我将讨论更复杂的一般的GROUP BY子句。

简单的GROUP BY子句

使用simple GROUP BY子句,你可以根据单个列、多个列或表达式来聚合数据。根据GROUP BY子句中指定的列和/或表达式,只对每个唯一的值返回一个汇总行。当SQL Server处理一个GROUP BY子句时,它会根据独特的列或表达式值对详细的记录进行分组,然后根据选择列表中包含的聚合函数对每个集合进行汇总。

为了更好地了解如何使用GROUP BY,假设你有一个表,其中包含不同商店的详细销售信息,您希望通过商店来总结总销售额。你可以使用GROUP BY子句来聚合每个商店的总销售额。在本例中,你分组的唯一列将是商店名称,而要聚合的列将是销售额。你的结果将显示每个唯一的商店名的一行,并且每个存储的行将包含该商店的销售额之和。

SQL Server对哪些列可以被包含在GROUP BY查询的SELECT列表中有一些限制。GROUP BY查询中SELECT列表中的指定的每一列都需要被归入以下类别之一:

•在GROUP BY子句中指定的列

•在GROUP BY子句中指定的表达式

•从聚合函数返回的值

如果一个列不属于这些类别之一,那么当你试图通过运行你的GROUP BY查询时,您将会得到一个错误提示。注意,GROUP BY子句中包含的列或表达式不需要在select列表中。

让我通过几个示例来帮助演示如何使用简单的GROUP BY子句获得汇总值。

用于探索简单的GROUP BY子句的示例数据

为了演示如何使用一个简单的GROUP BY子句,我需要构建一些示例数据。我提供了一个脚本来创建我的示例数据,这样你就可以运行本文中提供的示例代码。使用清单1中的脚本构建并填充示例表。

翻译Stairway to T-SQL DML Level 7: Summarizing Data Using a Simple GROUP BY Clause翻译Stairway to T-SQL DML Level 7: Summarizing Data Using a Simple GROUP BY Clause

清单1:创建示例数据的脚本

如果你查看了清单1中的脚本,你会发现我创建了表dbo.SalesTransaction,然后,我将一些记录插入到这个表中。我将使用这个表来演示如何使用一个简单的GROUP BY子句来聚合数据。

按单个列分组

使用清单1创建的示例表,第一个示例将基于单个列使用GROUP BY子句来汇总数据。清单2中的示例总结了基于StoreName列的示例数据。

翻译Stairway to T-SQL DML Level 7: Summarizing Data Using a Simple GROUP BY Clause

清单2:基于单个列的GROUP BY

当清单2中的代码在我的示例表中执行时,将返回报告1中的以下汇总行。

翻译Stairway to T-SQL DML Level 7: Summarizing Data Using a Simple GROUP BY Clause

报告1:基于单个列汇总样本数据。

如果你检查报告1中的输出,可以看到,只有一个聚合行被返回来获得每个独特的StoreName值。每个记录中的StoreSalesAmount都是通过使用SUM函数将每个商店的销售记录的TotalSalesAmount列相加来计算的。

按多列分组

有时,您需要开发一个报表,其中您的数据需要按多个列分组。为了实现这一点,您所需要做的就是向GROUP BY子句添加额外的列。当在GROUP BY子句中指定多个列时,SQL Server将根据GROUPBY子句中每个值的唯一组合聚合详细的行。在清单3中,我扩展了清单2中的查询,向GROUP BY子句中添加了第二列。

翻译Stairway to T-SQL DML Level 7: Summarizing Data Using a Simple GROUP BY Clause

清单3:基于单个列的组

当我针对我的示例数据运行清单3中的代码时,我在报表 2中得到了结果。

 翻译Stairway to T-SQL DML Level 7: Summarizing Data Using a Simple GROUP BY Clause

报表2:运行列表1的输出

在报表2中,您可以看到StoreSalesAmount现在在StoreName SalesTypeDesc级别上进行了总结。还要注意,返回的聚合行不是按GROUP  BY子句中的列排序的顺序。如果我希望汇总数据出现在 StoreName排序中,那么我需要在SELECT语句中包含一个ORDER BY子句。我将让您在清单3的代码中添加 ORDER BY,以返回StoreName顺序中的汇总数据。

使用GROUP  BY子句中的表达式

有时,您可能希望根据特定列或列集以外的内容对数据进行分组。例如,您可能希望根据某些VARCHAR列的前几个字符,或者仅仅是 DATETIME 列的日期或月份来总结您的数据。SQL Server允许您在GROUP BY子句中指定表达式以完成这一任务。表达式可以是基于正在聚合的详细记录集中的列的任何有效表达式。要演示如何在GROUP BY子句中使用表达式,请查看清单4中的代码。

翻译Stairway to T-SQL DML Level 7: Summarizing Data Using a Simple GROUP BY Clause

清单4:基于单个列的组

在清单4中,SELECT语句根据表达式对数据进行分组,在本例中是一个转换函数。如果在GROUP BY子句中使用表达式,则必须在SELECT列表中使用相同的表达式。转换函数解析SalesDateTime列,并仅返回该列的日期部分。使用GROUP BY子句中的转换函数,我可以根据不同销售记录的实际日期总结销售数据。通过这样做,我能够总结我的示例,以便按日期获得所有商店的TotalSalesAmount,如报告3所示。

 翻译Stairway to T-SQL DML Level 7: Summarizing Data Using a Simple GROUP BY Clause

报表3:根据表达式汇总数据时的输出

使用表达式可以让您以编程方式识别将使用详细数据的哪些部分来聚合数据。

HAVING 子句

如果要使用GROUP BY子句聚合数据,则可能不希望返回所有聚合值。相反,您可能希望只返回聚合值的子集。HAVING子句可用于选择性地标识您希望通过GROUP BY汇总返回的聚合值。

通常,当我们选择数据时,我们使用WHERE子句来限制返回的行。唯一的问题是WHERE子句操作行值,而不是聚合值。因此,WHERE子句无法使用GROUP BY子句创建的聚合值。然而,在GROUP BY子句之后添加HAVING子句为您提供了一种指定条件的方法,以标识要返回的特定汇总值。为了更好地理解这一点,让我给你们举几个例子。

在查看商店销售数据时,HAVING子句可能用于确定不满足特定销售配额的商店。如果您想找到所有没有达到最低销售金额的商店,可以使用清单5中的代码来实现这一点。

翻译Stairway to T-SQL DML Level 7: Summarizing Data Using a Simple GROUP BY Clause

清单5:使用HAVING子句限制结果集

在清单5中,我将结果集限制在聚集的TotalSalesAmount小于1000.00的商店中。在我这里的简单示例中,您会发现“计算机图书和软件”的StoreName是唯一没有达到1000.00美元销售限额的商店。

HAVING子句可以用于也没有聚合的列。如果您想限制根据GROUP BY子句中使用的任何列的特定值返回的行,那么您也可以这样做,清单6演示了此操作。

翻译Stairway to T-SQL DML Level 7: Summarizing Data Using a Simple GROUP BY Clause

清单6:基于GROUP BY列限制结果集

在清单6中,我只想看到商店名称中有“Outlet”或“Books”的商店的汇总数据,这个示例还演示了在HAVING子句中可以有多个条件。另一种思考WHERE和HAVING之间区别的方法是,WHERE子句在数据聚合之前过滤掉数据行,而HAVING子句在应用GROUP BY之后过滤聚合行。

用简单GROUP BY子句总结数据

在本文中,我向您展示了如何使用简单的GROUP BY子句来总结您的数据。我讨论了如何使用单个列、多列以及GROUP BY子句中的表达式来总结详细数据。通过使用我演示的内容,您现在应该能够构建一个简单的GROUP BY子句来总结您的数据,可选地使用HAVING过滤汇总数据。

在我的下一篇文章中,我将扩展我对GROUP  BY子句的讨论。在这篇后续文章中,我将向您展示如何使用多维数据集和汇总操作符来生成额外的汇总数据,如小计值和总计值。

本文是T-SQL DML楼梯的一部分。