要想处理Oracle数据库查询和取出表中重复记录,需要先了解ROWID---伪列。
ROWID 是一种数据类型,他是用基于64位编码的18个字符来唯一标识一条记录的物理位置的一个ID,类似于表的主键,ROWID一般情况是按照递增的顺序排序的,默认情况下
索引也是按照ROWID的顺序来显示的,所以对于完全相同的两条记录,结果会按照ROWID的顺序来进行排序。
ROWID可以被查询,例如:select rowid,a.* from emp a.
这次主要是利用ROWID来进行重复数据的处理,所以ROWID不做过于详细的介绍,下面说下利用ROWID处理重复数据。
假设emp表存储如下:
IDNO NAME SEX AGE
1101 Sherry 1 25
1102 Nancy 1 26
1101 Sherry 1 25
查询重复记录SQL如下:
select *
from emp a
where (rowid,a.IDNO) not in (select max(rowid),a.IDNO
from emp a
group by a.IDNO)
sql解读:红色字体会查询出来不重复的记录,那么关联外面的,rowid不在后面结果集的,即重复记录。
可以自己扩展,比如我要去除重复记录ROWID最大或者最小的值等等,了解远原理之后,变形SQL即可。
另外可以看下下面的SQL
select gv.idno, gv.name
from dept fg,
(select g.idno, g.name
from emp g
where (rowid, g.idno) in
(select max(rowid), t.idno
from emp t
group by t.policy_code)
) gv
where fg.idno=gv.idno
and fg.deptno='001'