元字符大概可以分为2类:
(1)用来匹配文本的
(2)正则表达式的语法所要求的。
空白元字符
元字符
|
说明
|
[\b]
|
回退(并删除)一个字符(Backspace键)
|
\f
|
换页符
|
\n
|
换行符
|
\r
|
回车符
|
\t
|
制表符(Tab键)
|
\v
|
垂直制表符
|
Windows所使用的文本行结束标签\r\n。一般使用两个\r\n\r\n匹配两条记录之间的空白行
Linux/Unix系统上匹配空白行只使用\n\n即可
同时适用Windows和Linux/Unix的正则表达式:[\r]?\[\r]?[\n]
数字元字符
元字符
|
说明
|
\d
|
任何一个数字字符(等价于[0-9])
|
\D
|
任何一个非数字字符(等价于[^0-9])
|
字母数字元字符
元字符
|
说明
|
\w
|
任何一个字母数字字符(大小写均可)或下划线字符(等价于[a-zA-Z0-9_])
|
\W
|
任何一个非字母数字或非下划线字符(等价于[^a-zA-Z0-9_])
|
空白字符元字符
元字符
|
说明
|
\s
|
任何一个空白字符(等价于[\f\n\r\t\v])
|
\S
|
任何一个非空白字符(等价于[^\f\n\r\t\v])
|
在正则表达式里,十六进制数值要用前缀\x给出。如\x0A
在正则表达式里,八进制数值要用前缀\0给出。如\011
使用POSIX字符类:
使用POSIX字符类的模式以[[开头,以]]结尾。POSIX字符类必须扩在[:和:]之间。如[:xdigit:]
用来进行大小写转化的元字符
元字符
|
说明
|
\E
|
结束\L或\U转换
|
\l
|
把下一个字符转化为小写
|
\L
|
把\L到\E之间的字符全部转换为小写
|
\u
|
把下一个字符转换为大写
|
\U
|
把\U到\E之间的字符全部转换为大写
|