Oracle中的正则表达式离不开这4个函数:
1. regexp_like
2. regexp_substr
3. regexp_instr
4. regexp_replace
看函数名称大概就能猜到有什么用了。
regexp_like 只能用于条件表达式,和 like 类似,但是使用的正则表达式进行匹配,语法很简单:
regexp_substr 函数,和 substr 类似,用于拾取符合正则表达式描述的字符子串,语法如下:
regexp_instr 函数,和 instr 类似,用于标定符合正则表达式的字符子串的开始位置,语法如下:
regexp_replace 函数,和 replace 类似,用于替换符合正则表达式的字符串,语法如下:
这里解析一下几个参数的含义:
1。source_char,输入的字符串,可以是列名或者字符串常量、变量。
2。pattern,正则表达式。
3。match_parameter,匹配选项。
取值范围: i:大小写不敏感; c:大小写敏感;n:点号 . 不匹配换行符号;m:多行模式;x:扩展模式,忽略正则表达式中的空白字符。
4。position,标识从第几个字符开始正则表达式匹配。
5。occurrence,标识第几个匹配组。
6。replace_string,替换的字符串。
Sql代码
oracle 10g正则表达式 REGEXP_LIKE 用法
/*
ORACLE中的支持正则表达式的函数主要有下面四个:
1,REGEXP_LIKE :与LIKE的功能相似
2,REGEXP_INSTR :与INSTR的功能相似
3,REGEXP_SUBSTR :与SUBSTR的功能相似
4,REGEXP_REPLACE :与REPLACE的功能相似
它们在用法上与Oracle SQL 函数LIKE、INSTR、SUBSTR 和REPLACE 用法相同,
但是它们使用POSIX 正则表达式代替了老的百分号(%)和通配符(_)字符。
POSIX 正则表达式由标准的元字符(metacharacters)所构成:
'^' 匹配输入字符串的开始位置,在方括号表达式中使用,此时它表示不接受该字符集合。
'$' 匹配输入字符串的结尾位置。如果设置了 RegExp 对象的 Multiline 属性,则 $ 也匹
配 '\n' 或 '\r'。
'.' 匹配除换行符之外的任何单字符。
'?' 匹配前面的子表达式零次或一次。
'+' 匹配前面的子表达式一次或多次。
'*' 匹配前面的子表达式零次或多次。
'|' 指明两项之间的一个选择。例子'^([a-z]+|[0-9]+)$'表示所有小写字母或数字组合成的
字符串。
'( )' 标记一个子表达式的开始和结束位置。
'[]' 标记一个中括号表达式。
'{m,n}' 一个精确地出现次数范围,m=<出现次数<=n,'{m}'表示出现m次,'{m,}'表示至少
出现m次。
\num 匹配 num,其中 num 是一个正整数。对所获取的匹配的引用。
字符簇:
[[:alpha:]] 任何字母。
[[:digit:]] 任何数字。
[[:alnum:]] 任何字母和数字。
[[:space:]] 任何白字符。
[[:upper:]] 任何大写字母。
[[:lower:]] 任何小写字母。
[[:punct:]] 任何标点符号。
[[:xdigit:]] 任何16进制的数字,相当于[0-9a-fA-F]。
各种操作符的运算优先级
\转义符
(), (?:), (?=), [] 圆括号和方括号
*, +, ?, {n}, {n,}, {n,m} 限定符
^, $, anymetacharacter 位置和顺序
|
*/
示例:
创建表并初始化数据
--创建表
create table fzq (
id varchar(4),
value varchar(10)
);
--插入数据
insert into fzq values ('1','1234560');
insert into fzq values ('2','1234560');
insert into fzq values ('3','1b3b560');
insert into fzq values ('4','abc');
insert into fzq values ('5','abcde');
insert into fzq values ('6','ADREasx');
insert into fzq values ('7','123 45');
insert into fzq values ('8','adc de');
insert into fzq values ('9','adc,.de');
insert into fzq values ('10','1B');
insert into fzq values ('10','abcbvbnb');
insert into fzq values ('11','11114560');
insert into fzq values ('11','11124560');
--提交
commit;
关于 regexp_like 和like 的验证比较:
tbs@TICKET> select * from fzq where value like '1____60';
ID VALUE
---- ----------
1 1234560
2 1234560
3 1b3b560
tbs@TICKET> select * from fzq where regexp_like(value,'1....60');
ID VALUE
---- ----------
1 1234560
2 1234560
3 1b3b560
11 11114560
11 11124560
tbs@TICKET> select * from fzq where regexp_like(value,'1[0-9]{4}60');
ID VALUE
---- ----------
1 1234560
2 1234560
11 11114560
11 11124560
tbs@TICKET> select * from fzq where regexp_like(value,'1[[:digit:]]{4}60');
ID VALUE
---- ----------
1 1234560
2 1234560
11 11114560
11 11124560
tbs@TICKET> select * from fzq where not regexp_like(value,'^[[:digit:]]+$');
ID VALUE
---- ----------
3 1b3b560
4 abc
5 abcde
6 ADREasx
7 123 45
8 adc de
9 adc,.de
10 1B
10 abcbvbnb
已选择9行。
tbs@TICKET> -- 查询value中不是纯数字的记录
tbs@TICKET> select * from fzq where not regexp_like(value,'^[[:digit:]]+$');
ID VALUE
---- ----------
3 1b3b560
4 abc
5 abcde
6 ADREasx
7 123 45
8 adc de
9 adc,.de
10 1B
10 abcbvbnb
已选择9行。
tbs@TICKET> -- 查询value中不包含任何数字的记录。
tbs@TICKET> select * from fzq where regexp_like(value,'^[^[:digit:]]+$');
ID VALUE
---- ----------
4 abc
5 abcde
6 ADREasx
8 adc de
9 adc,.de
10 abcbvbnb
已选择6行。
www.2cto.com
tbs@TICKET> --查询以12或者1b开头的记录.不区分大小写。
tbs@TICKET> select * from fzq where regexp_like(value,'^1[2b]','i');
ID VALUE
---- ----------
1 1234560
2 1234560
3 1b3b560
7 123 45
10 1B
tbs@TICKET> --查询以12或者1b开头的记录.区分大小写。
tbs@TICKET> select * from fzq where regexp_like(value,'^1[2B]');
ID VALUE
---- ----------
1 1234560
2 1234560
7 123 45
10 1B
tbs@TICKET> -- 查询数据中包含空白的记录。
tbs@TICKET> select * from fzq where regexp_like(value,'[[:space:]]');
ID VALUE
---- ----------
7 123 45
8 adc de
tbs@TICKET> --查询所有包含小写字母或者数字的记录。
tbs@TICKET> select * from fzq where regexp_like(value,'^([a-z]+|[0-9]+)$');
ID VALUE
---- ----------
1 1234560
2 1234560
4 abc
5 abcde
10 abcbvbnb
11 11114560
11 11124560
已选择7行。
tbs@TICKET> --查询任何包含标点符号的记录。
tbs@TICKET> select * from fzq where regexp_like(value,'[[:punct:]]');
ID VALUE
---- ----------
9 adc,.de
tbs@TICKET>
tbs@TICKET> select * from dual where regexp_like('b', '^[abc]$');
www.2cto.com
D
-
X
tbs@TICKET>
tbs@TICKET> select * from dual where regexp_like('abc', '^[abc]$');
未选定行
tbs@TICKET>
tbs@TICKET> select * from dual where regexp_like('abc', '^a[abc]c$');
D
-
X
欢迎大家继续补充~
24 个解决方案
#1
[已推荐!
, 学习学习
, 这里有之前从论坛里整理的几个例子,答案不唯一,仅供参考:
1.输入一个字符串,返回原字符串每个字符间加1个空格的新串
例如:传入 "abcde" 返回"a b c d e"
传入 "王小明" 返回"王 小 明"
2.有一张表table1,里面两个字段itemid和itemname,当itemid的尾数是000000结尾时,itemname原有名称不变;当itemid尾数为0000,且不为000000时,itemname前加两个全角空格;其他情况下itemname前加四个全角空格。
3. 现在有一个字段是一个大字段,格式类似于{{{111,222,333,444,555,666},{777,888,999,aaa,bbb,ccc},{ddd,eee,fff,ggg,hhh,iii}}} 现在想要得到444,666和aaa,ccc和ggg,iii这种数据
4. select 'aaa,bbb,ccc,ddd,eee,fff' from dual
union all
select 'ddd,qqq,12,3333,42687,opqe' from dual
怎么得到倒数第二段和倒数第三段呢?
with t3 as (
select 'aaa,bbb,ccc,ddd,eee,fff' str from dual
union all
select 'ddd,qqq,12,3333,42687,opqe' str from dual)
第一种:
第二种:
可以用这个就少了后面的一个空格 了
, ASDASASDASD, 棒棒达,感谢楼主分享。, 收藏,学习 , , 整理很详细 , 仔细看了一下,听仔细的,我也是别人推荐看到的,我会继续推荐的, oracle 11g中新增正则函数:regexp_count()
regexp_count() 作为 regexp_instr() 函数的一个补充,用于计算模式字符串在源串中出现的次数
函数语法如下:
对于参数 source_char,pattern,position,match_param 的含义参照上面解释。
示例如下:
1.输入一个字符串,返回原字符串每个字符间加1个空格的新串
例如:传入 "abcde" 返回"a b c d e"
传入 "王小明" 返回"王 小 明"
select regexp_replace('asdlfj','(.)','\1 ') from dual
2.有一张表table1,里面两个字段itemid和itemname,当itemid的尾数是000000结尾时,itemname原有名称不变;当itemid尾数为0000,且不为000000时,itemname前加两个全角空格;其他情况下itemname前加四个全角空格。
select decode(regexp_instr(itemid,'000000$'),0,decode(regexp_instr(itemid,'0000$'),0,to_multi_byte(' ')||itemname,to_multi_byte(' ')||itemname),itemname)
from table1
3. 现在有一个字段是一个大字段,格式类似于{{{111,222,333,444,555,666},{777,888,999,aaa,bbb,ccc},{ddd,eee,fff,ggg,hhh,iii}}} 现在想要得到444,666和aaa,ccc和ggg,iii这种数据
with t as(select '{{{111,222,333,444,555,666},{777,888,999,aaa,bbb,ccc},{ddd,eee,fff,ggg,hhh,iii}}}' str from dual)
select regexp_replace(str,'{+([^,]+,){3}([^,]+,)[^,]+,([^,}]+)}+','\2\3')
from t
4. select 'aaa,bbb,ccc,ddd,eee,fff' from dual
union all
select 'ddd,qqq,12,3333,42687,opqe' from dual
怎么得到倒数第二段和倒数第三段呢?
with t3 as (
select 'aaa,bbb,ccc,ddd,eee,fff' str from dual
union all
select 'ddd,qqq,12,3333,42687,opqe' str from dual)
第一种:
select rtrim(regexp_replace(str,'([^,]+,){3}(([^,]+,){2})([^,]+)','\2'),',')
from t3
第二种:
select regexp_replace(str,'([^,]+,){3}([^,]+,)([^,]+),([^,]+)','\2\3'), ,
from t3
select regexp_replace('asdlfj','(.)','\1 ') from dual
可以用这个就少了后面的一个空格 了
select regexp_replace('asdlfj','(.)',' \1',2) from dual
, ASDASASDASD, 棒棒达,感谢楼主分享。, 收藏,学习 , , 整理很详细 , 仔细看了一下,听仔细的,我也是别人推荐看到的,我会继续推荐的, oracle 11g中新增正则函数:regexp_count()
regexp_count() 作为 regexp_instr() 函数的一个补充,用于计算模式字符串在源串中出现的次数
函数语法如下:
对于参数 source_char,pattern,position,match_param 的含义参照上面解释。
示例如下:
, 看到使用频率较高~~ 学习了, , 增长见识了 谢谢楼主。技术就是要大家讨论几分享, , 表示,呵呵,收藏了学习下, 关注一下 , 感谢分享!辛苦大大!, 很好的分享,学习了!, 学习了。56, 很好的分享,学习学习, 这几个函数我记得在051中由类似的题,remark 学习下。, 收到收到收到收到]
The following example shows that subexpressions parentheses in pattern are ignored:
SELECT REGEXP_COUNT('123123123123123', '(12)3', 1, 'i') REGEXP_COUNT
FROM DUAL;
REGEXP_COUNT
------------
5
In the following example, the function begins to evaluate the source string at the third character, so skips over the first occurrence of pattern:
SELECT REGEXP_COUNT('123123123123', '123', 3, 'i') COUNT FROM DUAL;
COUNT
----------
3
#1
[已推荐!
, 学习学习
, 这里有之前从论坛里整理的几个例子,答案不唯一,仅供参考:
1.输入一个字符串,返回原字符串每个字符间加1个空格的新串
例如:传入 "abcde" 返回"a b c d e"
传入 "王小明" 返回"王 小 明"
2.有一张表table1,里面两个字段itemid和itemname,当itemid的尾数是000000结尾时,itemname原有名称不变;当itemid尾数为0000,且不为000000时,itemname前加两个全角空格;其他情况下itemname前加四个全角空格。
3. 现在有一个字段是一个大字段,格式类似于{{{111,222,333,444,555,666},{777,888,999,aaa,bbb,ccc},{ddd,eee,fff,ggg,hhh,iii}}} 现在想要得到444,666和aaa,ccc和ggg,iii这种数据
4. select 'aaa,bbb,ccc,ddd,eee,fff' from dual
union all
select 'ddd,qqq,12,3333,42687,opqe' from dual
怎么得到倒数第二段和倒数第三段呢?
with t3 as (
select 'aaa,bbb,ccc,ddd,eee,fff' str from dual
union all
select 'ddd,qqq,12,3333,42687,opqe' str from dual)
第一种:
第二种:
可以用这个就少了后面的一个空格 了
, ASDASASDASD, 棒棒达,感谢楼主分享。, 收藏,学习 , , 整理很详细 , 仔细看了一下,听仔细的,我也是别人推荐看到的,我会继续推荐的, oracle 11g中新增正则函数:regexp_count()
regexp_count() 作为 regexp_instr() 函数的一个补充,用于计算模式字符串在源串中出现的次数
函数语法如下:
对于参数 source_char,pattern,position,match_param 的含义参照上面解释。
示例如下:
1.输入一个字符串,返回原字符串每个字符间加1个空格的新串
例如:传入 "abcde" 返回"a b c d e"
传入 "王小明" 返回"王 小 明"
select regexp_replace('asdlfj','(.)','\1 ') from dual
2.有一张表table1,里面两个字段itemid和itemname,当itemid的尾数是000000结尾时,itemname原有名称不变;当itemid尾数为0000,且不为000000时,itemname前加两个全角空格;其他情况下itemname前加四个全角空格。
select decode(regexp_instr(itemid,'000000$'),0,decode(regexp_instr(itemid,'0000$'),0,to_multi_byte(' ')||itemname,to_multi_byte(' ')||itemname),itemname)
from table1
3. 现在有一个字段是一个大字段,格式类似于{{{111,222,333,444,555,666},{777,888,999,aaa,bbb,ccc},{ddd,eee,fff,ggg,hhh,iii}}} 现在想要得到444,666和aaa,ccc和ggg,iii这种数据
with t as(select '{{{111,222,333,444,555,666},{777,888,999,aaa,bbb,ccc},{ddd,eee,fff,ggg,hhh,iii}}}' str from dual)
select regexp_replace(str,'{+([^,]+,){3}([^,]+,)[^,]+,([^,}]+)}+','\2\3')
from t
4. select 'aaa,bbb,ccc,ddd,eee,fff' from dual
union all
select 'ddd,qqq,12,3333,42687,opqe' from dual
怎么得到倒数第二段和倒数第三段呢?
with t3 as (
select 'aaa,bbb,ccc,ddd,eee,fff' str from dual
union all
select 'ddd,qqq,12,3333,42687,opqe' str from dual)
第一种:
select rtrim(regexp_replace(str,'([^,]+,){3}(([^,]+,){2})([^,]+)','\2'),',')
from t3
第二种:
select regexp_replace(str,'([^,]+,){3}([^,]+,)([^,]+),([^,]+)','\2\3'), ,
from t3
select regexp_replace('asdlfj','(.)','\1 ') from dual
可以用这个就少了后面的一个空格 了
select regexp_replace('asdlfj','(.)',' \1',2) from dual
, ASDASASDASD, 棒棒达,感谢楼主分享。, 收藏,学习 , , 整理很详细 , 仔细看了一下,听仔细的,我也是别人推荐看到的,我会继续推荐的, oracle 11g中新增正则函数:regexp_count()
regexp_count() 作为 regexp_instr() 函数的一个补充,用于计算模式字符串在源串中出现的次数
函数语法如下:
对于参数 source_char,pattern,position,match_param 的含义参照上面解释。
示例如下:
, 看到使用频率较高~~ 学习了, , 增长见识了 谢谢楼主。技术就是要大家讨论几分享, , 表示,呵呵,收藏了学习下, 关注一下 , 感谢分享!辛苦大大!, 很好的分享,学习了!, 学习了。56, 很好的分享,学习学习, 这几个函数我记得在051中由类似的题,remark 学习下。, 收到收到收到收到]
The following example shows that subexpressions parentheses in pattern are ignored:
SELECT REGEXP_COUNT('123123123123123', '(12)3', 1, 'i') REGEXP_COUNT
FROM DUAL;
REGEXP_COUNT
------------
5
In the following example, the function begins to evaluate the source string at the third character, so skips over the first occurrence of pattern:
SELECT REGEXP_COUNT('123123123123', '123', 3, 'i') COUNT FROM DUAL;
COUNT
----------
3