在C#措施设计中经常会遇到这样的需求,要求匹配出成对的小括号里的内容,但是一般正则表达式中的 ?R 的语法似乎在C#中不被撑持, 颠末一番查找与测试,终于找到以下一段描述
/( 应该是 \( 不是用 /转义而是用 \来转义
匹配嵌套的结构
微软公司已经包罗了一个有趣的创新来匹配不变的结构(历史上,这是正则表达式所做不到的)。这并不容易掌握 ― 尽管这节较短,但是注意,它非常的晦涩难懂。
从一个例子开始可能更简单一些,所以我用这段代码作为开始:
Regex r = new Regex(@"/((?>[^()]+|/((?<DEPTH>)|/)(?<-DEPTH>))*(?(DEPTH)(?!))/)");
这能匹配到首个完全配对的括号组,好比”before (nope (yes (here) okay) after”里面的”(yes (here) okay)”。注意第一个左括号没有被匹配到,因为没有和它匹配的右括号。
下面是它如何运作的概览:
1、在每个”(“被匹配到的时候,”(?<DEPTH>)”在这里加上一,报告正则表达式系统当前括号嵌套的深度( 正则表达式开头的”/(“不包孕在这里)。
2、在每个”)”被匹配到的时候,”(?<-DEPTH>)”从深度值内减一。
3、”(?(DEPTH)(?!))”保证在匹配最后一个右括号之前深度为零。
它能事情的原因在于引擎的回逆仓库生存了匹配告成的组的轨迹。”(?<DEPTH>)”不过是一个带有名称的分组结构,它将总是匹配告成(不匹配任何对象)。而由于它被紧接着放在”/(“之后,它的告成匹配(仍然在仓库上直到被移除)被用于左括号的计数。
译注:还有一种写法是”(?<DEPTH>/()”,
我小我私家对照喜欢这种形式,而不是”/((?<DEPTH>)”。后面的”/)(?<-DEPTH>)”也是一样。
这样,匹配告成了的名为”DEPTH”的分组的计数在回逆仓库上被成立起来。而当找到右括号的时候我们还但愿从深度值减一,这是由.NET特另外语法结构”(?<-DEPTH>)”实现的,它将从仓库上移除比来匹配的”DEPTH”分组。如果仓库上已经没有记录,”(?<-DEPTH>)”分组匹配掉败,从而防备了正则表达式系统匹配多余的右括号。
最后,”(?(DEPTH)(?!))”是一个用于”(?!)”的断言,如果”DEPTH”分组到目前为止还是告成的话。如果当我们匹配到这里时还是告成的,这里有个未配对的左括号还没有被”(?<-DEPTH>)”移除。在这种情况,我们但愿遏制匹配(我们不但愿匹配一个未配对的括号),所以我们使用”(?!)”,它是一个“零宽度负预测先行断言”,仅当子表达式不在此位置的右侧匹配时才继续匹配。
这就是在.NET的正则表达式实现中匹配嵌套布局的要领。
以上内容似乎很难懂, 其实如果觉的难懂的话也简单,那你就不要去理解,你只要能用就OK了,把() 替换成你要的字符,相信可以解决不少你的问题,
以下按照这个用法写了个测试用例
private void button3_Click( object sender, EventArgs e ) { Regex r = new Regex( @"/[(?>[^/[/]]+|/[(?<DEPTH>)|/](?<-DEPTH>))*(?(DEPTH)(?!))/]" ); StringBuilder sb = new StringBuilder(); MatchString( "[111[222[333]]][222[333]][333]", r, sb ); MessageBox.Show( sb.ToString(), "取到的信息" ); } private void MatchString( string OutString, Regex r, StringBuilder sb ) { MatchCollection ms = r.Matches( OutString );// 获取所有的匹配 foreach ( Match m in ms ) { if ( m.Success ) { sb.AppendLine( m.Groups[0].Value ); MatchString( m.Groups[0].Value.Substring( 1, m.Groups[0].Value.Length - 1 ), r, sb );// 去失匹配到的头和尾的 "[" 和 "]",,制止陷入死循环递归中,导致溢出 } } return; }
可以得到
[111[222[333]]] [222[333]] [333] [222[333]] [333] [333]