【问题】现在有两个千万级别的结构相同数据不同数据表T_SMS_PHONENO(目的表),T_SMS_PHONENO2(源表),根据源表数据更新目的表的数据。
【分析】根据经验,更新方法一般有以下几种:
1、直接update。
update T_SMS_PHONENO T Set T.NAME=(select NAME from T_SMS_PHONENO2 where PHONENO=T.PHONENO)
2、采用分条更新。根据记录ID逐条更新。
open cur is select phoneno,name from T_SMS_PHONENO;
loop
fetch cur in v_pn,v_name;
update T_SMS_PHONENO T set T.NAME=v_name where v_pn=T.phoneno;
exit when cur% notfound;
end loop
3、采用分批次更新。将数据按表分区字段或其他字段依次进行分批次更新。
open cur is select region from T_SMS_PHONENO group by region;
loop
fetch cur in v_region;
update T_SMS_PHONENO T set T.NAME=(select name from T_SMS_PHONENO2 where phoneno=T.Phoneno) where T.region=v_region;
exit when cur% notfound;
end loop
4、虚拟一张表,唯一关联后进行更新。
update (select T.name,T2.name name2 from T_SMS_PHONENO T,T_SMS_PHONENO2 T2 where T.phoneno=T2.phoneno) set name=name2;
5、Create 一张新表后进行更新。
create table TEMP_SMS_PHONENO as select * from T_SMS_PHONENO T,T_SMS_PHONENO2 T2 where T.phoneno=T2.phoneno;
生成新表,然后重命名表为T_SMS_PHONENO
【结论】
1、对于大表的更新如果采用直接update语句,则会直接产生大量回滚,并且时间很长,出现假死现象。
2、1小时。
3、30分钟。
4、2分钟。
5、30秒,因为不产生redo,undo动作,insert语句会很快。
如果存在唯一性关联字段的话,则采用第四种方法更新,是很快的,如果不存在唯一关联字段则需要分批次更新,或者create 个新表。