第四章 使用元字符

时间:2023-01-01 11:43:49
元字符大概可以分为2类:
(1)用来匹配文本的
(2)正则表达式的语法所要求的。
 
空白元字符
 
元字符
说明
[\b]
回退(并删除)一个字符(Backspace键)
\f
换页符
\n
换行符
\r
回车符
\t
制表符(Tab键)
\v
垂直制表符
 
Windows所使用的文本行结束标签\r\n。一般使用两个\r\n\r\n匹配两条记录之间的空白行
Linux/Unix系统上匹配空白行只使用\n\n即可
 
同时适用Windows和Linux/Unix的正则表达式:[\r]?\[\r]?[\n]
 
 
数字元字符
 
元字符
说明
\d
任何一个数字字符(等价于[0-9])
\D
任何一个非数字字符(等价于[^0-9])
 
 
字母数字元字符
 
元字符
说明
\w
任何一个字母数字字符(大小写均可)或下划线字符(等价于[a-zA-Z0-9_])
\W
任何一个非字母数字或非下划线字符(等价于[^a-zA-Z0-9_])
 
 
空白字符元字符
 
元字符
说明
\s
任何一个空白字符(等价于[\f\n\r\t\v])
\S
任何一个非空白字符(等价于[^\f\n\r\t\v])
 
 
 
在正则表达式里,十六进制数值要用前缀\x给出。如\x0A
在正则表达式里,八进制数值要用前缀\0给出。如\011
 
 
使用POSIX字符类:
使用POSIX字符类的模式以[[开头,以]]结尾。POSIX字符类必须扩在[:和:]之间。如[:xdigit:]
 
 
用来进行大小写转化的元字符
 
 
元字符
说明
\E
结束\L或\U转换
\l
把下一个字符转化为小写
\L
把\L到\E之间的字符全部转换为小写
\u
把下一个字符转换为大写
\U
把\U到\E之间的字符全部转换为大写