mysql分组后，取每组第一条数据或最新一条

环境

MySQL：5.7
Java：1.8

SQL语句的写法：

select * from (select distinct(a.id) tid, a.* from template_detail a
               where a.template_id in (3, 4)
              order by a.id desc) tt
group by tt.template_id;

思路：先进行排序，然后再进行分组，获取每组的第一条。

通过子查询中的order by desc就可以做到是每组最新一条，还是第一条。
通过实践，我们知道这种查询方式，与分组子查询相比性能慢了些，慢一点点

-- 这种查询方式更快一丢丢
SELECT bb.`detail`, bb.`id`,bb.`template_id` 
from `template_detail` bb 
		INNER JOIN 
		( 
		    SELECT MAX(`id`) id, `template_id` 
		    from `template_detail` GROUP BY `template_id` 
		) as tb on bb.`id` = tb.id

Q: 为什么要写distinct()呢？
A：防止合并的构造（derived_merge）；

什么是derived_merge？

derived_merge指的是一种查询优化技术，作用就是把派生表合并到外部的查询中，提高数据检索的效率。这个特性在MySQL5.7版本中被引入，可以通过如下SQL语句进行查看/开启/关闭等操作。

上面虽然听起来感觉很牛逼的样子，但是实际情况是，这个新特性，不怎么受欢迎，容易引起错误。

可以在子查询中使用以下函数来进行关闭这个特性：

可以通过在子查询中使用任何阻止合并的构造来禁用合并，尽管这些构造对实现的影响并不明确。 防止合并的构造对于派生表和视图引用是相同的：
   1.聚合函数（ SUM() ， MIN() ， MAX() ， COUNT()等）
   ISTINCT
   3.GROUP BY
   4.HAVING
   IMIT
   6.UNION或UNION ALL
   7.选择列表中的子查询
   8.分配给用户变量
   9.仅引用文字值（在这种情况下，没有基础表）

子查询order by失效的场景

select * from (select a.* from template_detail a
               where a.template_id in (3, 4)
              order by a.id desc) tt
group by tt.template_id;

假设我们现在把distinct() tid, 去掉，会发现子查询（或者叫：临时表）中的order by desc失效了。
为什么会这样呢？

原理分析：

我们这里使用了临时表排序，继而对其结果进行分组，结果显示失败，加了distinct() tid, 后结果正确，原因是因为临时表（派生表derived table）中使用order by且使其生效，必须满足三个条件：

外部查询禁止分组或者聚合
外部查询未指定having，HAVING， order by
外部查询将派生表或者视图作为from句中唯一指定源

不满足这三个条件，order by会被忽略。

一旦外部表使用了group by，那么临时表（派生表 derived table）将不会执行filesort操作（即order by 会被忽略），所以我在临时表中加了（distinct()）。
加了之后就相当于关闭了该特性，所以也就生效了。

参考地址：

/doc/refman/5.7/en/

分组查询取每组最新的数据（order by 和group by使用问题）

mysql分组后获取每个组排序后的第一条数据（整行）

Mysql取分组后的每组第一条数据

秒客网

mysql分组后，取每组第一条数据或最新一条

环境

什么是derived_merge？

子查询order by失效的场景

相关文章