今天接到一任务,有一张学生信息表(Excel表),里面有一万多条记录,现在要把这张表导入到数据库中,并设置学生学号为主键,但是现在这张表中的学生学号有重复的记录,我必须先找出这些重复的记录,然后再进行筛选,经过研究问题终于得到解决。
以上问题实际上就是查询数据库表中某一字段值重复的记录,这里省略如何将Excel表导入到数据库步骤,只讨论用SQL查询数据库中某一字段下相同值的记录方法。
现在假设数据库表名为student,里面有字段Sno(学号),ID(身份证),这里提供两种查询的方法:
方法一:通过学号和身份证字段来查询(数据库执行效率高,推荐)
复制代码代码如下:
SELECT *
FROM student AS A
WHERE (Sno IN (SELECT Sno FROM student AS B WHERE A.ID <> B.ID))
方法二:只通过学号字段来查询(数据库执行效率低,不推荐)
复制代码代码如下:
SELECT *
FROM student AS A
WHERE (SELECT COUNT(*) FROM student WHERE Sno=A.Sno)>1
从运行结果来看,方法一和方法二相同,但是执行效率完全不同,方法一执行一万多条数据只需要几秒钟即可,方法二则需要好几分钟,而且还有死机现象。不知道还有没有其他方法,如果有高手知道请指教!!!