正则表达式元字符及说明

时间:2021-06-13 18:47:04
基本元字符
元字符 说明
. 匹配任意单个字符
| 逻辑或操作符
[] 定义一个字符集合,匹配该集合中的一个字符
[^] 对字符集合求非(是对整个集合求非,而不是紧挨着^符号的字符)
- 在字符集合中定义一个区间。如[A-Za-z]
\ 对下一个字符转义。比如\n表示换行。



数量元字符
元字符 说明
* 匹配前一个字符(子表达式)零次或多次
*? *的懒惰型版本(防止正则表达式的“贪婪性”)
+ 匹配前一个字符或子表达式一次或多次
+? +的懒惰型版本
? 匹配前一个字符或子表达式零次或一次
{n} 匹配前一个字符或子表达式的n次重复,比如[A-Z]{6}表示匹配由六个大写字母组成的字符串。
{m,n} t;\td> 匹配至少m次至多n次
{m,} 匹配至少m次
{m,}? {m,}的懒惰型版本



位置元字符
元字符 说明
^ 行首
$ 行尾
\< 单词开头
\> 单词结尾
\b 单词边界(单词的开头和结束)
\B \b的反义



特殊字符元字符
元字符 说明
[\b] 匹配一个退格字符
\c 匹配一个控制字符
\d 匹配任意一个数字字符,等价于[0-9]
\D \d的反义
\f 换页符
\n 换行符
\r 回车符
\s 匹配一个空白字符
\S \s的反义
\t 制表符
\v 垂直制表符
\w 匹配任意字母、数字、下划线。等价于[A-Za-z0-9_]
\W \w的反义
\x 匹配一个十六进制数字
\0 匹配一个八进制数字



回溯引用和前后查找
元字符 说明
() 定义一个子表达式
\1 第一个子表达式,同理\2表示第2个子表达式。\0通常表示整个正则表达式。
? 向前查找
?<= 向后查找
?! 负向前查找
?!= 负向后查找
?() 条件(if then)
?()| 条件(if then else)



另外\E,\l,\L,\U,\u等表示大小写转换。
原文基本copy参考一,但改了部分不正确的地方
更多请参考:
http://blog.csdn.net/jcwkyl/article/details/3868980
http://hi.baidu.com/mindox/item/240609191fb9cf01e3f98689