在Java中我们经常利用正则表达式来分割字符串,正则表达式的确给我们带来了诸多方便,但正则表达式中也有很多细节之处值得我们注意,否则就会给我们带来意想不到的结果。
下面是我总结的一些值得注意的地方:
(1)反斜杠在正则表达式中只能以偶数的次数连续出现
例如:\\(, \\{, \\\\
(2)特殊的字符在正则表达式中需要进行转义处理
特殊字符 | 处理方式 |
+ | \\+ |
? | \\? |
\ | \\\\ |
* | \\* |
^ | \\^ |
. | \\. |
$ | \\$ |
( | \\( |
) | \\) |
{ | \\{ |
} | \\} |
(3)如果正则表达式匹配的分割串出现在目标串的首部,则分割后产生的第一个字符串为空字符串
String[] str = "abcfhdjfabcjdkabc".split("(abc)+");
str[0]是一个空字符串
(4)当要指定正则表达式中分割字符串的次数时,应将分割字符串用()括起来
String[] str = "abcdfifjabcabcdfkabcabckgflh".split("(abc)+");