正则表达式总结,正则表达式匹配不包含某个字符串

时间:2021-08-15 05:52:17

1、匹配a标签及其url:

Regex regA = new Regex(@"<a[\s]+[^<>]*href=(?:""|')([^<>""']+)(?:""|')[^<>]*>([^<>]+)</a>", RegexOptions.IgnoreCase);

说明:在上面的正则表达式中,

用来匹配href属性前面和后面的各种属性:

[^<>]*

用来匹配href属性引号中间的url:

([^<>""']+)

用来匹配a标签之间的内容:

([^<>]+)

 

2、匹配img标签及其url:

 Regex regImg = new Regex(@"<img[\s]+[^<>]*src=(?:""|')([^<>""']+(?:\.jpg|\.jpeg|\.png|\.gif))(?:""|')[^<>]*>", RegexOptions.IgnoreCase);

 

3、匹配标签及标签中间的内容:

reg = new Regex(@"<dl class=""ksDl"">(?:(?!</dl>)[\s\S])*</dl>", RegexOptions.IgnoreCase);

或:

reg = new Regex(@"<dl class=""ksDl"">(?:(?!class=""ksDl"")[\s\S])*</dl>", RegexOptions.IgnoreCase);

 说明:当html字符串如下时,可以匹配到两处,

<dl class="ksDl"><div>测试</div></dl>
<dl class="ksDl"><div>测试</div></dl>

如果正则表达式这样写:

reg = new Regex(@"<dl class=""ksDl"">[\s\S]*</dl>", RegexOptions.IgnoreCase);

则只能匹配一处。请注意下面这部分的作用,它在匹配中间内容的时候排除了</dl>

(?:(?!</dl>)[\s\S])*

 

4、匹配<#if == and an== and == an9 and i9 == "9i" and 99p==>中的==、an==、== an9、i9 == "9i"和99p==

Regex reg = new Regex(@"([\s]+(?:and){0,1}(?:(?!and)[^\s])*[\s]*==[\s]*(?:(?!and)[^\s>])*[\s]*)", RegexOptions.IgnoreCase);

说明:

(?:(?!and)[^\s])*

表示匹配的字符串不包含and且不包含空白字符