前言
正则表达式是javascript非常重要和常用的功能,在jquery等大型框架中用的非常频繁,最近抽时间学习了解了相关知识,记录下来与需要的朋友分享。
思维导图
RegExp(正则表达式)的创建方式
可以通过两种方式创建一个RegExp,具体如下:
通过/…./的方式来创建正则表达式(注意: /……/两边是没有单引号或双引号的)
通过RegExp构造方法来创建一正则表达式
为了更好的描述模式,正则表达式提供了3个标识,分别是: g/i/m
g: 全局匹配:在整个字符串中匹配,而不是在第一次匹配后之后停止
i: 忽略大小写匹配
m: 对多行字符串中的每一行,应用行首和行末的特殊字符(分别是^和$)
具体看参照下面代码加深理解:
1
2
|
var regx = new RegExp( 'are' , 'g' );
var regx1 = /are/g; //常用的创建方式
|
RegExp实例的主要属性
根据RegExp的构造函数,我们大概也能猜到RegExp的主要属性,关于实例属性,了解下就可以了。但有一点要注意:这些实例属性是不能通过for in进行遍历获取的。
可参照下面代码加深理解:
1
2
3
4
5
6
7
8
9
|
var regx1 = /are/g; //常用的创建方式
console.log( "source:" +regx.source + " global:" +regx.global+ " ignoreCase:" +regx.ignoreCase + " multiline:" +regx.multiline);
// source:are global:true ignoreCase:false multiline:false
for ( var p in regx) { //不会进入该for循环
if (regx.hasOwnProperty(p)) {
console.log(regx[p]);
}
}
|
RegExp实例的主要方法 - test
根据该方法非常简单,只有一个参数,常用来验证输入的参数与正则表达式模式是否匹配,如果匹配返回true,否则返回false. 可参照下面代码加深理解:
1
2
3
4
5
|
var regx1 = /are/g;
var res = regx.test( 'you are a good boy!' );
console.log(res) ; //true
var res1 = regx.test( 'I am a good boy!' );
console.log(res1) ; //false
|
RegExp实例的主要方法 - exec
法该方法是一个非常常用的方法,需要好好理解。它只接收一个参数,即要匹配的字符串,返回值却是一个数组arr,数组里存储的是第一个匹配项的相关信息,包括:
input: 要匹配的字符串,exec方法的输入值
index:匹配性在字符串中的位置
arr[0]: 模式匹配的字符串
arr[1]…arr[n]: 第n个捕获组字符串
使用该方法时要注意:如果在正则表达式中未指定全局标志g,则每次执行始终返回的都是第一个匹配项,如果设置了全局标志g,每次调用exec,则会在字符串中继续查找新匹配项
可参照下面代码加深理解:
1
2
3
4
5
6
7
8
9
|
var regx = /fn:(\w+)\s+ln:(\w+)\s/g;
var s = "your fn:xiaoxin ln:tang right?" ;
var result = regx.exec(s);
console.log(result.input); //your fn:xiaoxin ln:tang right?
console.log(result.index); //5
console.log(result[0]); //fn:xiaoxin ln:tang
console.log(result[1]); //xiaoxin
console.log(result[2]); //tang
console.log(result[3]); //undefined 因为只有2个捕获组,所以打印undefined
|
RegExp构造函数属性
关于函数属性,可以参照其它编程语言(如java)中类的静态属性来理解,这些属性被所有的RegExp实例共享,也就是所有的RegExp都可以访问和修改这些属性,当某个实例执行test或exec方法时,这些属性的值也将跟着发生变化
关于这些属性,我们可以按照自己的理解记忆:
input : 需要进行模式匹配的字符串,test或exec方法的输入参数。 参数别名: $-
lastMatch : 最近一次匹配项 。 参数别名:$&
leftContext : 匹配项左边的字符串。参数别名:$`
rightContext : 匹配项右边的字符串 。 参数别名:$'
1,2,$3….: 捕获组对应的字符串 。
当然这些值,完全可以通过RegExp实例执行exec返回的结果计算得到,那为什么要在构造函数RegExp中设置这些属性呢?*
可参照下面代码加深理解:
1
2
3
4
5
6
7
8
9
|
var regx = /fn:(\w+)\s+ln:(\w+)\s/g;
var s = "your fn:xiaoxin ln:tang right?" ;
var result = regx.exec(s);
console.log(RegExp.input); //your fn:xiaoxin ln:tang right?
console.log(RegExp.lastMatch); //fn:xiaoxin ln:tang
console.log(RegExp.leftContext); //your
console.log(RegExp.rightContext); //right?
console.log(RegExp.$1); //xiaoxin
console.log(RegExp.$2); //tang
|
RegExp - 元字符
与其它语言中的正则表达式类似, js正则表达式中也存在一些元字符,这些字符有特殊的用途和含义,所以在使用的过程中,需要对这些字符进行转义,通过在这些字符前加上'\' 进行转义处理. JS正则表达是的元字符有:
( [ { \ ^ $ | ) ? * + . ] }
RegExp - 贪婪匹配和懒惰匹配
贪婪匹配就是在正则表达式的匹配过程中,默认会使得匹配长度越大越好。在JS正则表达式中,懒惰限定符是 ‘?' ,在模式中添加 ‘?' 则要求是懒惰匹配。具体参照下面代码来理解:
1
2
3
4
5
|
var s = 'I am a good boy,you are also a good boy !' ;
var regx = /good.*boy/g; //贪婪匹配
console.log(regx.exec(s)[0]); //good boy,you are also a good boy
var regx1 = /good.*?boy/g; //懒惰匹配
console.log(regx1.exec(s)[0]); //good boy
|
以上内容是小编给大家分享的javascript正则表达式和字符串RegExp and String(一),下篇文章给大家分享javascript正则表达式和字符串RegExp and String(二)希望大家喜欢。