字符串匹配——正则表达式

时间:2022-09-06 05:43:05

检验用户输入信息是否符合规则,经常要用到正则表达式,类似手机号、E-mail的格式判定等,这里简单介绍一下正则表达式的匹配规则吧。
一、在正则表达式中,如果直接给出字符,就是精确匹配。
\d 可以匹配一个数字
\w 可以匹配一个字母或数字
\s 可以匹配一个空格(也包括Tab等空白符)
. 可以匹配任意字符

二、要匹配变长的字符,在正则表达式中,
* 表示任意个字符(包括0个)
+ 表示至少一个字符
? 表示0个或1个字符
{n} 表示n个字符
{n,m} 表示n-m个字符

例如:\d{3}\s+\d{3,8}

\d{3} 表示匹配3个数字,例如’123’;

\s 可以匹配一个空格(也包括Tab等空白符),所以\s+表示至少有一个空格,例如匹配’ ‘,’\t\t’等;

\d{3,8} 表示3-8个数字,例如’12345678’。

如果要匹配带区号的电话号码如:’010-12345’
由于’-‘是特殊字符,在正则表达式中,要用’\’转义,所以,上面的正则是\d{3}-\d{3,8}

三、要做更精确地匹配,可以用[]表示范围,如:

[0-9a-zA-Z\_] 可以匹配一个数字、字母或者下划线;

[0-9a-zA-Z\_]+ 可以匹配至少由一个数字、字母或者下划线组成的字符串,比如’a123’,’0_z’,’Js2017’等等;

[a-zA-Z\_\$][0-9a-zA-Z\_\$]* 可以匹配由字母或下划线、$开头,后接任意个由一个数字、字母或者下划线、$组成的字符串,也就是JavaScript允许的变量名;

[a-zA-Z\_\$][0-9a-zA-Z\_\$]{0, 19} 更精确地限制了变量的长度是1-20个字符(前面1个字符+后面最多19个字符)。

A|B 可以匹配A或B,所以(J|j)ava(S|s)cript 可以匹配’JavaScript’、’Javascript’、’javaScript’或者’javascript’。

^ 表示行的开头,^\d 表示必须以数字开头。

$ 表示行的结束,\d$ 表示必须以数字结束。