正则表达式用于字符串处理,表单验证等场合,实用高效,但用到时总是不太把握,以致往往要上网查一番。我将一些常用的表达式收藏在这里,作备忘之用。本贴随时会更新,请持续关注本站。
匹配中文字符的正则表达式: [\u4e00-\u9fa5]
匹配双字节字符(包括汉字在内):[^\x00-\xff]
应用:计算字符串的长度(一个双字节字符长度计2,ASCII字符计1)
1
|
String.prototype.len= function (){ return this .replace([^\x00-\xff]/g, "aa" ).length;}
|
匹配空行的正则表达式:\n[\s| ]*\r
匹配HTML标记的正则表达式:/<(.*)>.*<\/\1>|<(.*) \/>/
匹配首尾空格的正则表达式:(^\s*)|(\s*$)
1
2
3
4
|
String.prototype.trim = function ()
{
return this .replace(/(^\s*)|(\s*$)/g, "" );
}
|
利用正则表达式分解和转换IP地址:
下面是利用正则表达式匹配IP地址,并将IP地址转换成对应数值的Javascript程序:
1
2
3
4
5
6
7
8
9
10
11
12
|
function IP2V(ip)
{
re=/(\d+)\.(\d+)\.(\d+)\.(\d+)/g //匹配IP地址的正则表达式
if (re.test(ip))
{
return RegExp.1∗Math.pow(255,3))+RegExp.2*Math.pow(255,2))+RegExp.3∗255+RegExp.4*1
}
else
{
throw new Error( "Not a valid IP address!" )
}
}
|
不过上面的程序如果不用正则表达式,而直接用split函数来分解可能更简单,程序如下:
1
2
3
|
var ip= "10.100.20.168"
ip=ip.split( "." )
alert( "IP值是:" +(ip[0]*255*255*255+ip[1]*255*255+ip[2]*255+ip[3]*1))
|
匹配Email地址的正则表达式:\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*
匹配网址URL的正则表达式:http://([\w-]+\.)+[\w-]+(/[\w- ./?%&=]*)?
利用正则表达式去除字串中重复的字符的算法程序:[注:此程序不正确,原因见红色字体]
1
2
3
4
5
|
var s= "abacabefgeeii"
var s1=s.replace(/(.).*\1/g, "$1" )
var re= new RegExp( "[" +s1+ "]" , "g" )
var s2=s.replace(re, "" )
alert(s1+s2) //结果为:abcefgi
|
===============================
如果var s = "abacabefggeeii"
结果就不对了,结果为:abeicfgg
正则表达式的能力有限
我原来在CSDN上发贴寻求一个表达式来实现去除重复字符的方法,最终没有找到,这是我能想到的最简单的实现方法。思路是使用后向引用取出包括重复的字符,再以重复的字符建立第二个表达式,取到不重复的字符,两者串连。这个方法对于字符顺序有要求的字符串可能不适用。
得用正则表达式从URL地址中提取文件名的javascript程序,如下结果为page1
1
2
3
|
s= "http://www.9499.net/page1.htm"
s=s.replace(/(.*\/){0,}([^\.]+).*/ig, "$2" )
alert(s)
|
利用正则表达式限制网页表单里的文本框输入内容:
用正则表达式限制只能输入中文:
1
|
onkeyup= "value=value.replace(/[^\u4E00-\u9FA5]/g,'')" onbeforepaste= "clipboardData.setData('text',clipboardData.getData('text').replace(/[^\u4E00-\u9FA5]/g,''))"
|
用正则表达式限制只能输入全角字符:
1
|
onkeyup= "value=value.replace(/[^\uFF00-\uFFFF]/g,'')" onbeforepaste= "clipboardData.setData('text',clipboardData.getData('text').replace(/[^\uFF00-\uFFFF]/g,''))"
|
用正则表达式限制只能输入数字:
1
|
onkeyup= "value=value.replace(/[^\d]/g,'') " onbeforepaste= "clipboardData.setData('text',clipboardData.getData('text').replace(/[^\d]/g,''))"
|
用正则表达式限制只能输入数字和英文:
1
|
onkeyup= "value=value.replace(/[\W]/g,'') " onbeforepaste= "clipboardData.setData('text',clipboardData.getData('text').replace(/[^\d]/g,''))"
|
应用:javascript中没有像vbscript那样的trim函数,我们就可以利用这个表达式来实现,如下:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
|
/**
* 计算字符串长度,将非宽字符计算为半个字符
*
* @param str
* @returns
*/
function gbLength(str) {
return typeof str === "string" ? str.length + str.replace(/[\x00-\x7f]/g, '' ).length + 1 >> 1 : 0;
}
/**
* 获取字符串的指定长度的子串,将非宽字符计算为半个字符
*
* @param str
* @param length
* @returns
*/
function gbSubstr(str, length) {
if ( typeof str !== "string" )
return str;
length += length;
for ( var n = 0, L = str.length; n < L && length > 0; n++){
length -= str.charCodeAt(n) > 127 ? 2 : 1;
}
return str.substr(0, n);
}
/**
* 切割指定字符串的指定长度子串,如果长度超过指定长度,则丢弃末尾两个字符并附加...
*
* @param str
* @param len
* @returns
*/
function fit_length(str, len){
len = len || 16;
if ( typeof str !== "string" || str.length <= len || gbLength(str) <= len){
return str;
}
var ret = gbSubstr(str, len - 2);
return ret + '..' ;
}
var replaceCJK = /[^\x00-\xff]/g,
testCJK = /[^\x00-\xff]/;
cjkLength: function (strValue){
return strValue.replace(replaceCJK, "lv" ).length;
},
isCjk: function (strValue){
return testCJK.test(strValue);
},
cutString: function (str,len,suffix,slen){
suffix = suffix || '' ;
slen = slen || suffix.length;
if (str.length > len){
str = str.substr(0,len - slen) + suffix;
}
return str;
},
cutCjkString: function (str,len,suffix,slen){
suffix = suffix || '' ;
slen = slen || suffix.length;
len -= slen;
if ( this .cjkLength(str) <= len){
return str;
}
var s = str.split( '' ),c = 0,tmpA = [];
for ( var i=0;i<s.length;i+=1){
if (c < len){
tmpA[tmpA.length] = s[i];
}
if ( this .isCjk(s[i])){
c += 2;
} else {
c += 1;
}
}
return tmpA.join( '' ) + suffix;
}
}
|
以上内容给大家分享我日常收集的一些常用的正则表达式(匹配中文字符、匹配双字节字符、匹配HTML标记、匹配空行 and so on~~~),希望大家喜欢。欲了解更多,请持续关注本站。