正则表达式之g标志,match和 exec

时间:2022-05-12 19:43:57

1.g标志

   g标志一般是与match和exec来连用,否则g标志没有太大的意义,先来看一个带g标志的例子:

var str = "tankZHang (231144) tank ying (155445)";
var res = str.match(/tank/); //没有加/g
console.log(res);
//返回一个数组,数组有三个成员,一个是匹配的对象、在一个index:0(匹配到的位置)和input(原字符串)
["tank", index: 0, input: "tankZHang (231144) tank ying (155445)"]
res = str.match(/tank/g); //加了/g
// 返回一个数组,数组包含匹配了几个tank
console.log(res); //显示为tank,tank

那么我们知道g的标志是:我是一个全局标志符,我要告诉处理字符串函数是单个处理字符串还是全局处理字符串。

通过刚刚的测试可以知道:

当正则含有g标志时,全局查找,结果数组的元素0到n中包含所有匹配。

没有g标志时:数组有三个成员,一个是匹配的对象、在一个index:0(匹配到的位置)和input(原字符串)。

2.exec函数

 先来看一个例子:

 var str = "tankZHang (231144) tank ying (155445)";
var res = /tank/.exec(str); //没有加/g
console.log(res);
res = /tank/g.exec(str); //加了/g
console.log(res);
//显示结果,两者一样,和match不带有g标志三者相同
//["tank", index: 0, input: "tankZHang (231144) tank ying (155445)"]
//["tank", index: 0, input: "tankZHang (231144) tank ying (155445)"]

那么exec的作用是什么?在正则表达式,在有全局标志的情况下:

var objStr = "我的手机号13522222222,他的手机号13288888888,她的手机号码13699999999";
var reg = /13(\d)(\d{8})/g;
console.log("reg="+ reg.lastIndex);
var arr = reg.exec(objStr);
console.log(reg.lastIndex);
console.log(arr);
//reg=0 初始lastIndex
//16 第一次匹配之后lastIndex调整为16
//["13522222222", "5", "22222222", index: 5, input: "我的手机号13522222222,他的手机号13288888888,她的手机号码13699999999"]
//"5"和"22222222"为第一个匹配的两个分组

如果我们需要获取匹配所有的详细信息可以通过patt.exec(str)来获得例如:

var str = "Visit W3School, W3School is a place to study web technology.";
var patt = new RegExp("W3School","g");
var result; while ((result = patt.exec(str)) != null) {
document.write(result);
document.write("<br />");
document.write(patt.lastIndex);
document.write("<br />");
}
// W3School
//
// W3School
//

每一个Regexp对象有个source成员:指向该正则表达式。

3.匹配前端静态文件

/\.((png|jpe?g|gif|svg)|(woff2?|eot|ttf|otf)|js|css)(\?.*)?$/;

4.正则表达式(前瞻,后瞻,非捕获性分组,惰性量词)

4.1 前瞻

符号是?=,例如:

var xx="abcde";
xx= xx.split(new RegExp('(?=a)|d'));
//“?=a”表示以a前面进行分割,new RegExp('(?=a)|d')表示以a前面的字符串或者d进行分割。
//结果是:xx[0]=abc;xx[1]=d。
//另一个例子
var regex = /(bed(?=room))/, //匹配bed的后面是room
str1="bedroom",
str2 ="roombed";
console.log(regex.test(str1)); //true;
console.log(regex.test(str2)); //false;

4.2 后瞻

符号是?!,相对于前瞻的反面

var regex = /(bed(?!room))/,
str1="bedroom",
str2 ="bedxxx";
console.log(regex.test(str1)); //false; bed的后面有room为false,其他为true。
console.log(regex.test(str2)); //true;

现在有更高级的搞法。\B+(边界)。\b+(非边界)。

var regex = /\B(room)/;
var str1="bedroom";
var str2 ="bedxxx";
console.log(str1.replace(regex,'-$1')); //bed-room
console.log(regex.test(str2)); //false; 

4.3 非捕获性分组

符号是: 括号前面加个?:

var regex = /windows (?:98|2000|2003)/;
console.log("windows 2003".match(regex)); //没有分组这个概念
//["windows 2003", index: 0, input: "windows 2003"]
var regex = /windows (98|2000|2003)/;
console.log("windows 2003".match(regex));
//["windows 2003", "2003", index: 0, input: "windows 2003"]

4.4惰性量词

贪婪量词?  * + {n} {n,} {n, m},惰性量词就是贪婪量词的后面加个‘?’,例如:

var str = "abbbaabbbaaabbb1234";
var patt1 = /.*bbb/g; //贪婪的 得到结果 ["abbbaabbbaaabbb"]
var patt2 = /.*? bbb/g; //惰性的 得到结果
//["abbb", "aabbb", "aaabbb"]

获取一级域名:

var url = require('url');
var myUrl = url.parse("http://n.51blb.com");
console.log(myUrl.hostname.replace(/^[\S^\.]*?\./,""));
//51blb.com

推荐一个在线验证正则表达式的网站:

https://regexper.com/