sql查询 找出重复数据,并且只保留一条.

时间:2024-10-22 08:45:26

1.(错误操作)查所有的重复数据

很明显下列代码运行速度很慢

select * from 表 t where (select count(*) fromwhere 字段1=t.字段1 AND 字段2=t.字段2)>1 

所以我们使用下面的分组

1.(速度优化) 查所有的重复数据

SELECT * 
FROMWHERE (字段1, 字段2, 字段3) IN (SELECT 字段1, 字段2, 字段3 FROMGROUP BY 字段1, 字段2, 字段3 HAVING COUNT(*) > 1) 
ORDER BY 排序字段

2.查找出重复的数据

SELECT id, 字段1, 字段2, 字段3 
FROMWHERE id
IN (SELECT MIN(id) FROMGROUP BY 字段1, 字段2, 字段3 HAVING COUNT(*) > 1)

3.过滤(字段1, 字段2, 字段3)全部重复相同的数据,只显示一条(id最小或最大等)数据,包含原本不重复的数据(建议使用)

SELECT * 
FROMWHERE id
IN (SELECT MIN(id) FROMGROUP BY 字段1, 字段2, 字段3)

4.获取到2的结果后就可以通过单条或者多条一起进行删除






我的Github地址,欢迎大家加入我的开源项目,或者(在我的主页联系我)加入你们的开源项目,点点Github-Stars。

\ 开源项目名称 依赖类型 版本号 描述
1 spring-boot-starter-trie pom 1.0.0-SNAPSHOT 特定需求下查询速度远超开源检索工具,innodb下B+树或者ES中倒排索引无法与之比拟.
2 spring-boot-starter-trie jar 1.0.0-M1 提供了基于SpringCloud的服务节点,可以通过Nacos注册中心进行服务发现,实现了树的动态扩容与缩容,以及服务的动态上下线。
3 Data-Provider pom 1.0.0-SNAPSHOT 提供了多种数据源的查询,以及数据的类型同步,作为一个Jar可以依赖在其他服务上动态的提供数据。