一起做面试题--如何删除数据库表中的重复数据

这个问题也经常考到，所以我就来说一下。

假设有这样的数据：

表名asshole，字段如上。

思路就是先确定重复记录的判断依据，这里的一句就是name，symptom，age三个字段都相同。所以先用group by语句查出相同name、symptom、age字段下的最小id是什么？必须确保有个自增字段或者能区分他们的字段，否则很难办了就，正常数据库表都有主键字段。

第一个SQL如下：

select min(id) from asshole group by name,symptom,age;

这个SQL查询出了以后三个字段分组，id最小的那个。

删除的话，就保留id最小的那个其他都删了就行了。

完整SQL如下

delete from asshole where not exists (select 1 from (select min(id) as min from asshole group by name,symptom,age) k where k.min=id);

就是把非分组后最小id的其他id记录都删掉。

秒客网