表达式
可匹配
\d
任意一个数字,0~9中的任意一个
\w
任意一个字母或数字或下划线,也就是A~Z,a~z,0~9,_中任意一个
\s
包括空格、制表符、换页符等空白字符中的任意一个
.
小数点可以匹配除了换行符(\n)以外的任意一个字符
[]
使用[]包含一系列字符,能够匹配其中任意一个字符
[^ ]
使用[^ ]包含一系列字符,则能够匹配其中字符外的任意一个字符
{n}
该表达式放在被修饰的表达式的后边,n表示重复匹配的次数
{m,n}
表达式至少重复m次,最多重复n次。比如"ba{1,3}"可以匹配"ba","baa","baaa"
?
匹配表达式0次或1次,相当于{0,1}
+
表达式至少出现一次,相当于{1,}
*
相当于{0,},表达式不出现或出现任意次
^
与字符串开始的地方匹配,不匹配任何字符
$
与字符串结束的地方匹配,不匹配任何字符
\b
匹配一个单词边界,也就是单词和空格之间的位置,不匹配任何字符
|
左右两边表达式之间"或"关系,匹配左边或者右边
()
(1).在被修饰匹配次数的时候,括号中的表达式可以作为整体被修饰
(2).取匹配结果的时候,括号中的表达式匹配到的内容可以被单独得到
在修饰匹配次数的特殊符号后再加上一个"?"号,则可以使匹配次数不定的表达式尽可能少的匹配,使可匹配可不匹配的表达式,尽可能的"不匹配"。这种匹配原则叫做"非贪婪模式",也叫作"勉强"模式。
\xXX
编号在0~255范围内的字符,比如,空格可以用"\x20"表示
\xXXXX
任何字符可以使用"\u"再加上其编号的4位十六进制数表示。比如"\u4E2D"
\S
匹配所有非空白字符
\D
匹配所有非数字字符
\W
匹配所有的字母、数字、下划线以外的字符
\B
匹配非单词边界,即左右两边都是"\w"范围或者左右两边都不是"\w"范围时的字符缝隙