PL/SQL批处理语句(BULK COLLECT子句和FORALL语句)

时间:2021-11-11 07:28:08

Oracle为PL/SQL中的SQL相关功能提供了FORALL语句和BULK COLLECT子句,显著的增强了SQL相关功能。这两个语句一起被称作PL/SQL的批处理语句。Oracle为什么要提供这两个语句呢?我们首先了解一下PL/SQL的引擎。该引擎可以安装在数据库,或者应用开发工具上,例如Oracle Froms。当PL/SQL运行引擎执行一个代码块时,引擎本身只会处理过程语句,而SQL语句是发送给SQL引擎执行。SQL语句的执行时是由数据库的SQL引擎负责,再将执行结果返回给PL/SQL引擎。

以下是PL/SQL引擎运行原理:

PL/SQL批处理语句(BULK COLLECT子句和FORALL语句)

这种PL/SQL引擎和SQL引擎之间的控制转移叫做上下文切换。每次发生切换时,都会有额外的开销。通过FORALL语句和BULK COLLECT子句,可以把两个引擎的通行进行微调,让PL/SQL更有效地把多个上下文切换压缩成一个切换,从而提升程序的性能。

1.通过BULK COLLECT加速查询

不管是显示游标还是隐式游标,都可以通过BULK COLLECT在数据库的单次交互中获取多行数据。BULKCOLLECT减少了PL/SQL引擎和SQL引擎之间的切换次数,因此也减少了提取数据时的额外开销。

创建一张测试数据表:create table my_objects as select * from user_objects;

现在需要从my_objects表提取所有数据,我们通常的做法如下:

--FOR游标提取据

declare
  type nt_object is table of my_objects%rowtype;
  vnt_object   nt_object := nt_object(); --初始化
  v_count      number := 0;
  c_big_number number := power(2, 31);
  l_start_time pls_integer;
begin
  dbms_output.put_line('========FOR游标提取==========');
  l_start_time := dbms_utility.get_time;

for vrt_object in (select * from my_objects) loop
    vnt_object.extend;
    vnt_object(vnt_object.last) := vrt_object;
  end loop;
 
  dbms_output.put_line('count=' || vnt_object.count);
  dbms_output.put_line('Elapsed: ' ||
                       to_char(mod(dbms_utility.get_time - l_start_time +
                                   c_big_number,
                                   c_big_number)));
end;

--显示游标提取

declare
  type nt_object is table of my_objects%rowtype;
  vnt_object   nt_object := nt_object(); --初始化
  c_big_number number := power(2, 31);
  l_start_time pls_integer;

cursor cur_object is
    select * from my_objects;
  vrt_object cur_object%rowtype;

begin

dbms_output.put_line('========显示游标提取==========');
  l_start_time := dbms_utility.get_time;

open cur_object;
  loop
    fetch cur_object
      into vrt_object;
    exit when cur_object%notfound;
    vnt_object.extend;
    vnt_object(vnt_object.last) := vrt_object;
  end loop;

close cur_object;
  dbms_output.put_line('count=' || vnt_object.count);
  dbms_output.put_line('Elapsed: ' ||
                       to_char(mod(dbms_utility.get_time - l_start_time +
                                   c_big_number,
                                   c_big_number)));
end;

结果:FOR游标明显要优于显示游标
注意:要使用集合嵌套表,必须初始化。

这个代码毫无疑问可以完成任务,不过可能会花费很长的时间。假设my_objects表中有1000个记录,PL/SQL引擎就要向SGA中的游标发送10000个fetch操作。

为了帮组这种场景,可以在查询语句中的INTO元素中使用BULK COLLECT子句。对于游标使用这个子句是告诉SQL引擎把查询出来的多行数据库批量绑定到指定的集合上。然后再把控制返回给PL/SQL引擎。这个子句的语法是:

... BULK COLLECT INTO collection_name[,collection_name] ...

其中collection_name代表一个集合。

使用BULK COLLECT时,要记住以下这些规则和限制:

  • 在Oracle 9i数据之前,只能在静态SQL中使用BULK COLLECT。现在不论是动态还是静态SQL都可以使用BULK COLLECT。
  • 可以在下面这些语句中使用BULK COLLECT:SELECT INTO,FETCH INTO和RETURNING INTO。
  • 对于在BULK COLLECT子句中使用的集合,SQL引擎会自动进行初始化及扩展。它会从索引1开始填充集合,连续的插入元素(紧凑的),把之前已经使用的元素的值覆盖。
  • 不能在FORALL语句中使用SELECT...BULK COLLECT语句。
  • 如果SELECT...BULK COLLECT没有找到任何行,不会抛出NO_DATA_FOUND异常。相反,我们必须对集合的内容进行检查看看其中到底有没有数据。
  • 如果查询没有返回任何行,集合的COUNT方法将返回0。

1.1使用隐式游标

使用隐式游标(SELECT INTO)重写,并使用dbms_utility.get_time获取时间。

declare
  type nt_object is table of my_objects%rowtype;
  vnt_object   nt_object; --未初始化
  c_big_number number := power(2, 31);
  l_start_time pls_integer;

begin
  dbms_output.put_line('========BULK COLLECT批量提取==========');
  l_start_time := dbms_utility.get_time;

select * bulk collect into vnt_object from my_objects;

dbms_output.put_line('count=' || vnt_object.count);
  dbms_output.put_line('Elapsed: ' ||
                       to_char(mod(dbms_utility.get_time - l_start_time +
                                   c_big_number,
                                   c_big_number)));
end;

1.2使用显示游标

使用显示游标重写:

declare
  type nt_object is table of my_objects%rowtype;
  vnt_object   nt_object := nt_object(); --初始化
  c_big_number number := power(2, 31);
  l_start_time pls_integer;

cursor cur_object is
    select * from my_objects;
begin

dbms_output.put_line('========显示游标BULK COLLECT提取==========');
  l_start_time := dbms_utility.get_time;

open cur_object;
  fetch cur_object bulk collect
    into vnt_object;
  close cur_object;

dbms_output.put_line('count=' || vnt_object.count);
  dbms_output.put_line('Elapsed: ' ||
                       to_char(mod(dbms_utility.get_time - l_start_time +
                                   c_big_number,
                                   c_big_number)));
end;

1.3限制BULK COLLECT提取数据

Oracle为BULK COLLECT提供了一个LIMIT子句,让我们可以对从数据库提取的行的数量做限制,语法是:
   FETCH cursor BULK COLLECT INTO ... [LIMIT rows]

其中rows可是直接量、变量或者求值的结果是整数的表达式。

对于BULK COLLECT来说,LIMIT是非常有用的,因为这个语句可以帮助我们控制程序用多大内存来处理数据。比如,假设你需要查询并处理10000行的数据。你可以用BULK COLLECT一次取出所有的行,然后填充到一个非常大的集合中。可是,这种方法会消耗掉该会话的大量PGA内存。如果这个代码被多个Oracle模式运行,你的应用程序性能就可能会因为PGA换页而下降。

declare
  type nt_object is table of my_objects%rowtype;
  vnt_object_bulk nt_object;
  vnt_object      nt_object := nt_object(); --初始化

c_big_number number := power(2, 31);
  l_start_time pls_integer;

cursor cur_object is
    select * from my_objects;
begin

dbms_output.put_line('========显示游标BULK COLLECT LIMIT提取==========');
  l_start_time := dbms_utility.get_time;

open cur_object;
  loop
    fetch cur_object bulk collect
      into vnt_object_bulk limit 100;
    for i in vnt_object_bulk.first .. vnt_object_bulk.last loop
      vnt_object.extend;
      vnt_object(vnt_object.last) := vnt_object_bulk(i);
    end loop;
    exit when cur_object%notfound;
  end loop;
  close cur_object;

dbms_output.put_line('count=' || vnt_object.count);
  dbms_output.put_line('Elapsed: ' ||
                       to_char(mod(dbms_utility.get_time - l_start_time +
                                   c_big_number,
                                   c_big_number)));

end;

注意:这里是在循环的最后通过检查cur_object%notfound的值来结束循环。当每次只查询一条数据时,总是把这个代码紧跟在FETCH语句的后面。不过使用BULK COLLECT时就不能这么做了,因为当FETCH操作提取最后一部分数据集之后,游标虽然空了(%NOTFOUND会返回TRUE)但是在集合中还有一些元素需要处理。因此,或者在循环的最后检查%NOTFOUND属性,或者在FETCH操作之后立即查看集合的内容:

open cur_object;
  loop
    fetch cur_object bulk collect
      into vnt_object_bulk limit 100;
    exit when vnt_object_bulk.count = 0;

和在循环体的最后检查%NOTFOUND属性值比较起来,第二中方法的不好之处就在于我们需要额外再执行一个返回空行的FETCH操作。

2.通过FORALL加速DML

BULK COLLECT用于对查询加速。而FORALL会对插入、更新、删除以及合并做同样的事情(只有Oracle 11g才支持FORALL的合并)。FORALL告诉PL/SQL引擎要先把一个或者多个集合的所有成员都绑定到SQL语句中,然后在把语句发送给SQL引擎。

2.1FORALL语句的语法

尽管FORALL语句带有一个迭代模式,但它并不是一个FOR循环。因此,既不需要LOOP也不需要END LOOP语句。它的语法如下:

FORALL index IN
   [lower.bound .. upper.bound |
    INDICES OF indexing_collection |
    VALUES OF indexing_collection
   ]
   [SAVE EXCEPTIONS]
   sql_statement;

其中:

index

是一个整数,由Oracle隐式声明的,并被定义做集合的索引值。

lower_bound

操作开始的索引值。

upper_bound

操作结束的索引值。

sql_statement

将对每一个集合元素执行的SQL语句。

indexing_collection

这是一个PL/SQL集合,是一个指向sql_statement所使用的绑定数组的索引的集合。INDICES OF和VALUES OF是从Oracle 10g才有的。

SAVE EXCEPTIONS

这是一个可选的子句,告诉FORALL处理全部行,不过把发生的任何异常保存下来。

使用FORALL时,必须遵守这些规则:

  • FORALL语句的主体必须是一个单独的DML语句——可以是一个插入、更新、删除或者合并操作(Oracle 11g及以后版本)。
  • 上边界和下边界对于SQL语句所使用的集合来说,必须是一个有效的连续索引值范围。
  • DML语句中使用的集合下标不能是表达式。

2.2FORALL批量插入

从user_objects数据字典中中批量将所有数据插入到my_objects表中。

declare
  type nt_object is table of my_objects%rowtype;
  vnt_object   nt_object;
  c_big_number number := power(2, 31);
  l_start_time pls_integer;
begin

dbms_output.put_line('========批量插入==========');
  l_start_time := dbms_utility.get_time;

select * bulk collect into vnt_object from user_objects;
  forall i in vnt_object.first .. vnt_object.last
    insert into my_objects values vnt_object (i);

dbms_output.put_line('count=' || vnt_object.count);
  dbms_output.put_line('Elapsed: ' ||
                       to_char(mod(dbms_utility.get_time - l_start_time +
                                   c_big_number,
                                   c_big_number)));

end;

提示:在Oracle 10g及以后的版本中,PL/SQL编辑会自动对FOR游标循环进行优化,从而性能可以和BULK COLLECT相媲美。

参考:

Oracle PL/SQL程序设计(第五版) Steven Feuersterin & Bill Pribyl著 张晓明译