刚刚接到一个面试电话,对头的先生问我懂不懂触发器和存储过程,当时是觉得有些好笑,毕竟“视图、触发和存储”是咱数据库工程师的吉祥三宝,怎么可能不认识?只是稍后他还问了下游标这东西,仔细想想我是不常使用Cursor,因为大表用上游标来遍历会降低查询效率,一般都是推荐面向集合的方式来解决问题而非遍历。不过既然有游标这东西,必定有它存在的价值,不妨就来扒皮下游标~
有玩过asp这种过时语言的朋友应该很能理解游标是啥东西,其实就是一个指针指着数据集里的某一行,然后像asp中用dataset.NEXT()或者dataset.PRE()的代码(希望没写错,我不写asp很久了)让这个指针指向下一行或者上一行的数据。于是这个游标呀,从头指到尾,就完成一次遍历。一般来说特大的表就别玩游标了,尽量用面向集合、面向整体的途径来解决问题,毕竟游标是“读一行、处理一行、指向下一行。。。”,而后者是“一口气把需要操作的行全读出来然后一口气处理完”。
不过有时候写存储过程,涉及的又是小规模的表,那么游标也是挺有用的,也不唠嗑太多,下面讲游标(Cursor)的用法。
先说说游标的定义,其实很简单,跟我们定义一个变量一样:
DECLARE @youbiao CURSOR
那么赋值呢?的确跟常规变量赋值一样用SET,不过等号右方存在格式上的不同:
DECLARE @youbiao CURSOR
--赋值,等号右边要加CURSOR FOR select_command
SET @youbiao = CURSOR FOR
select * from table_name
当然上述的是游标变量的定义和赋值,而常规类型的游标定义与赋值如下:
DECLARE youbiao2 CURSOR
FOR
select * from table_name
好了,现在利用游标来实现下最简单的功能,比如我下面有这张叫series的很简单的表:
我想建个游标让它指向第二行,然后打印(PRINT)出该行的name(也就是“岭南艺术团”)出来。代码如下:
DECLARE youbiao CURSOR
FOR
select name from series OPEN youbiao
DECLARE @name NVARCHAR(20)
FETCH NEXT FROM youbiao INTO @name
FETCH NEXT FROM youbiao INTO @name
PRINT @name CLOSE youbiao
DEALLOCATE youbiao
如上我在“select name from series”的查询结果上建立了一个名为“youbiao”的游标,接着用OPEN youbiao打开此游标来使用其功能;
@name这个变量是用来存放我们从游标里获得的当行name字段的数据,接着后面的语句
FETCH NEXT FROM youbiao INTO @name
表示游标开始指向第一行,在这里要记住 FETCH NEXT FROM 游标名 INTO 变量名 的格式。
由于现在游标是指向首行,而我们想要第二行的数据,那么我们再写一句 FETCH NEXT FROM youbiao INTO @name 让游标指向第二行即可,然后打印出该行name字段的数据。
最后的CLOSE 和 DEALLOCATE 都是关闭、释放游标的关键字(其实只要用DEALLOCATE即可彻底销毁游标了,CLOSE只是暂时关闭,你可以用OPEN重新打开),这跟我们ADO.NET里con用完就con.close()掉一样是个必要的好习惯。
前面说过游标是拿来遍历的,如果一张表很多行,我们也不至于要写一堆“FETCH NEXT FROM XX INTO @XX”来让执行吧。当然不用,游标一般使用WHILE和@@FETCH_STATUS来遍历表,其中的@@FETCH_STATUS是一个全局变量,记住就行(你输入@@F的时候会有智能提示的,直接选就得了),代码如下:
DECLARE @id INT
DECLARE @name NVARCHAR(20)
DECLARE youbiao2 CURSOR
FOR
SELECT id,NAMe FROM series
OPEN youbiao2
FETCH NEXT FROM youbiao2 INTO @id,@name
WHILE ( @@FETCH_STATUS = 0 )
BEGIN
PRINT @id
PRINT @name
FETCH NEXT FROM youbiao2 INTO @id,@name END
CLOSE youbiao2
DEALLOCATE youbiao2
执行结果:
@@FETCH_STATUS是用于判断游标指针位置的全局变量,且 @@FETCH_STATUS默认值为0。其值和对应的意义如下:
值 | 意义 |
0 | FETCH 语句成功 |
-1 | 语句失败或此行不在结果集中 |
-2 | 被提取的行不存在 |
@@fetch_status值的改变是通过fetch next from实现的,若游标已在最后一行无法再FETCH NEXT了,则@@fetch_status的值会由0变为-1。
这里有个SQL的bug要说一下,尽量把第一条FETCH语句写在OPEN cursor_name的下一行,例如,若把OPEN写在WHILE外部而第一条FETCH语句写在WHILE内部可能会引起代码仅可成功执行一次的问题(再执行就只显示“命令已成功完成”的信息)。
好了,上面我们介绍了FETCH NEXT,下面来介绍下FETCH FIRST/LAST/PRIOR/ABSOLUTE n/RELATIVE n
FIRST/LAST/PRIOR 这三个很好理解,分别是指向第一行/最后一行/前一行,比如“FETCH PRIOR FROM youbiao2 INTO @id,@name”就是让游标youbiao2指向上一行的数据,这里就不赘述了。
对于后俩个“ABSOLUTE n”和“RELATIVE n”,搞前端的同学估计乐了,咱CSS的position也有absolute和relative可选呢~ 其实这儿也一样是“绝对”和“相对”的意思,其中ABSOLUTE n表示跳到第n行去,而RELATIVE n示跳到相对于当前行的第n行去,如:
注意代码中红圈处,我加了个参数SCROLL,这是因为若要动用到“ABSOLUTE n”和“RELATIVE n”等NEXT之外的选项,就必须加此SCROLL参数,表明允许游标往任意方向游走。如果不加SCROLL则默认为FORWARD_ONLY,表示只允许游标从头到尾游动。
下面借用其他前辈们的介绍文段来简略谈下游标更多的参数,这些前面没提到的参数用的比较少。
我们还是先看看MSDN中是怎样定义游标格式的:
DECLARE cursor_name CURSOR [ LOCAL | GLOBAL ]
[ FORWARD_ONLY | SCROLL ]
[ STATIC | KEYSET | DYNAMIC | FAST_FORWARD ]
[ READ_ONLY | SCROLL_LOCKS | OPTIMISTIC ]
[ TYPE_WARNING ]
FOR select_statement
[ FOR UPDATE [ OF column_name [ ,...n ] ] ]
[;]
作用域:LOCAL和GLOBAL二选一
LOCAL意味着游标的生存周期只在批处理或函数或存储过程中可见,而GLOBAL意味着游标对于特定连接作为上下文,全局内有效。如果不指定游标作用域,默认作用域为GLOBAL。
STATIC KEYSET DYNAMIC 和 FAST_FORWARD 四选一
这四个关键字是游标所在数据集所反应的表内数据和游标读取出的数据的关系。
STATIC意味着,当游标被建立时,将会创建FOR后面的SELECT语句所包含数据集的副本存入tempdb数据库中,任何对于底层表内数据的更改不会影响到游标的内容.
DYNAMIC是和STATIC完全相反的选项,当底层数据库更改时,游标的内容也随之得到反映,在下一次fetch中,数据内容会随之改变
KEYSET可以理解为介于STATIC和DYNAMIC的折中方案。将游标所在结果集的唯一能确定每一行的主键存入tempdb,当结果集中任何行改变或者删除时,@@FETCH_STATUS会为-2,KEYSET无法探测新加入的数据 FAST_FORWARD可以理解成FORWARD_ONLY的优化版本.
FORWARD_ONLY执行的是静态计划,而FAST_FORWARD是根据情况进行选择采用动态计划还是静态计划,大多数情况下FAST_FORWARD要比FORWARD_ONLY性能略好.
READ_ONLY SCROLL_LOCKS OPTIMISTIC 三选一
READ_ONLY意味着声明的游标只能读取数据,游标不能做任何更新操作
SCROLL_LOCKS是另一种极端,将读入游标的所有数据进行锁定,防止其他程序进行更改,以确保更新的绝对成功
OPTIMISTIC是相对比较好的一个选择,OPTIMISTIC不锁定任何数据,当需要在游标中更新数据时,如果底层表数据更新,则游标内数据更新不成功,如果,底层表数据未更新,则游标内表数据可以更新
游标其实也是一简单的东西,配合上FETCH ABSOLUTE n/RELATIVE n 神马的也能灵活地执行我们想要的操作,不过依旧如开头所说的,不到万不得已的情况还是别用游标好,这东西就跟索引在更新的时候一样,如果把一个特大的表循环遍历一遍,那真会是个伤心的故事。