正则表达式-重复匹配(二)

时间:2022-12-10 05:33:49
在前面一章中,讲了元字符的使用,前面没有明确说明,那就是每个元字符匹配一个字符,也就是说[\d]匹配任意一个数字。那么假设我想匹配三位数字怎么办,当然可以写成 \d\d\d 这种形式,但是要是我想匹配10位数字呢,岂不是要写10次\d。这样写当然也能解决问题,但是不够优雅,也不够简便。那么如何解决这个问题呢,这就是本章要讲到的重复匹配问题

“+”字符

这里要讲到的第一个字符是“+”加号,“+”匹配前面的元字符的至少一次。当然,如果你想匹配+本身,需要使用转义符,也就是\+。那么前面问题来了,至少要匹配1位及以上的数字的正则表达式如何写?
  • [\d]+

“*”字符

前文讲到匹配至少一个使用+符号,那么如果我想匹配0到多个就需要*符号了

“?”字符

如果想要匹配某个字符0次或1次,这个时候就需要使用?字符。举一个常见例子,假设我们想找到一段文本中连接的Url地址信息,就是以http开头或https开头的。这个时候就需要使用?字符了
  • http(s)?://[\w.]+

{m,n}或者{m,}

上面表达式是次数精确匹配的例子,{m,n}是匹配字符至少m次,最多n次的意思,而{m,}是至少匹配m次,而不设上限
  • [\d]{3,} 匹配至少三位以上数字

由于重复匹配有时候会出现匹配过多,也就是贪婪模式,往往结果不尽人意,因此,有时候我们需要使用懒惰模式,在表达式后面加一个?字符,防止过度匹配现象。其表达式形式类似如下例子

  • [\d]+?
  • [\d]*?