一、为什么要对数据进行分组
数据分组:是按照逻辑次序把具有重复值的字段进行合并。
二、GROUP BY子句
语法:
SELECT column1,column2
FROM table1,table2
WHERE conditions
GROUP BY column1,column2
ORDER BY column1,column2;
1、分组函数
典型的分组函数—也就是用于GROUP BY子句对数据进行划分的函数—包括AVG、MAX、MIN、SUM、COUNT。
2、对选中的数据进行分组
数据分组是个简单的过程。被选中的字段(查询中SELECT之后的字段列表)才能在GROUP BY子句里引用;如果字段在SELECT语句里找不到,就不能用于GROUP BY子句。
注:在对数据进行分组时,分组字段的次序不一定要与SELECT子句里字段次序相同。
3、创建分组和使用汇总函数
SELECT语句在使用GROUP BY子句时必须满足一定条件。特别是被选中的字段必须出现在GROUP BY子句里,除了汇总函数。
注:具体数值在排序时位于NULL值之前,字符型在排序时位于NULL值之后。
4、以整数代表字段名称
像ORDER BY子句一样,GROUP BY子句里也可以用整数代表字段名称。
三、GROUP BY和ORDER BY
ORDER BY子句专门用于对查询得到的数据进行排序,GROUP BY子句也把查询得到的数据排序为适当分组的数据,因此,GROUP BY子句也可以像ORDER BY子句那样用于数据排序。
使用GROUP BY子句实现排序操作的区别与缺点:
1、所有被选中的、非汇总函数的字段必须列在GROUP BY子句里;
2、除非需要使用汇总函数,否则使用GROUP BY子句进行排序通常是没有必要的。
四、CUBE和ROLLUP语句
ROLLUP语法:
GROUP BY ROLLUP(ordered column list of grouping sets)
MySQL ROLLUP语法:
GROUP BY order column list of grouping sets WITH ROLLUP
ROLLUP语句的工作方式:
1、在完成了基本的分组数据汇总以后,
2、按照从右向左的顺序,每次去掉字段列表中的最后一个字段,再对剩余的字段进行分组统计,并将获得的小计结果插入返回表中,被去掉的字段位置使用NULL填充。
3、最后,再对全表进行一次统计,所有的字段位置均使用NULL填充。
CUBE语法:
GROUP BY CUBE(column list of grouping sets)
CUBE语句在SQL Server和Oracle中都可以使用,MySQL尚不支持该语句。
CUBE语句的工作方式:
1、它对分组列表中的所有字段进行排列组合,并根据每一种组合结果,分别进行统计汇总。 2、最后,CUBE语句也会对全表进行统计。
五、HAVING子句
HAVING子句必须跟在GROUP BY子句之后,在ORDER BY子句之前。
语法:
SELECT column1,column2
FROM table1,table2
WHERE contidions
GROUP BY column1,column2
HAVING conditions
ORDER BY column1,column2;