java正则、、、 group详解

时间:2025-02-15 11:32:56

原文地址:/liupeifeng3514/article/category/7609718

1、 public String group()

     查看group()源码:

    public String group() {
        return group(0);
    }

可知 group() 实际调用了 group(int group) 方法,参数 group 为 0。组零表示整个模式。

♨ Java代码示例:

    Pattern p = ("(\\w+)%(\\d+)");
    Matcher m = ("ab%12-cd%34");
    if (()) {
        (());// ab%12
        ((0));// ab%12
    }


2、()、()、()

Matcher 类提供了三个匹配操作方法,三个方法均返回 boolean 类型,当匹配到时返回 true,没匹配到则返回 false 。

a、matches() 对整个字符串进行匹配,只有整个字符串都匹配了才返回true 。

Java代码示例:

Pattern p = ("\\d+");

Matcher m = ("22bb23");
(());// 返回false,因为bb不能被\d+匹配,导致整个字符串匹配未成功.

m = ("2223");
(());// 返回true,因为\d+匹配到了整个字符串

我们现在回头看一下(String regex,CharSequence input),它与下面这段代码等价 
(regex).matcher(input).matches()。

b、lookingAt() 对前面的字符串进行匹配,只有匹配到的字符串在最前面才返回true。

Java代码示例::

Pattern p = ("\\d+");

Matcher m = ("22bb23");
(());// 返回true,因为\d+匹配到了前面的22

m = ("aa2223");
(());// 返回false,因为\d+不能匹配前面的aa

c、find()对字符串进行匹配,匹配到的字符串可以在任何位置。

Java代码示例:

Pattern p = ("\\d+");

Matcher m = ("22bb23");
(());// 返回true

m = ("aa2223");
(());// 返回true

m = ("aa2223bb");
(());// 返回true

m = ("aabb");
(());// 返回false

3、 ()、()、()

当使用matches(),lookingAt(),find()执行匹配操作后,就可以利用以上三个方法得到更详细的信息:

start()返回匹配到的子字符串的第一个字符在原字符串中的索引位置;
end()返回匹配到的子字符串的最后一个字符在原字符串中的索引位置;
group()返回匹配到的子字符串。

♨ Java代码示例:

Pattern p = ("\\d+");                                                                    

("==========find 方法==========");                                                      
Matcher m = ("aaa2223bb");                                                                     
(());// 匹配2223                                                                  
(());// 返回3                                                                    
(());// 返回7,返回的是2223后的索引号                                                        
(());// 返回2223                                                                 

("==========lookingAt 方法==========");                                                 
m = ("2223bb");                                                                                
(()); // 匹配2223                                                            
(()); // 返回0,由于lookingAt()只能匹配前面的字符串,所以当使用lookingAt()匹配时,start()方法总是返回0        
(()); // 返回4                                                                     
(()); // 返回2223                                                                

("==========matches 方法==========");                                                   
m = ("2223bb");                                                                                
(()); // 匹配整个字符串,返回false,所以后边的执行会报错                                          
(());                                                                          
(());                                                                            
(());                                                                          

说了这么多,相信大家都明白了以上几个方法的使用,该说说正则表达式的分组在java中是怎么使用的。

a、start(int i)、end(int i),group(int i)、groupCount()
start(),end(),group()均有一个重载方法,它们是start(int i),end(int i),group(int i)专用于分组操作,Mathcer 类还有一个groupCount()用于返回有多少组。

♨ Java代码示例:

Pattern p = ("([a-z]+)(\\d+)");                         
Matcher m = ("aaa2223bb");                                    

(()); // 匹配aaa2223                             
(()); // 返回2,因为有2组                       
((1)); // 返回0 返回第一组匹配到的子字符串的第一个字符在原字符串中的索引号   
((2)); // 返回3 返回第二组匹配到的子字符串的第一个字符在原字符串中的索引号   
((1)); // 返回3 返回第一组匹配到的子字符串的最后一个字符在原字符串中的索引号    
((2)); // 返回7                                   
((1)); // 返回aaa,返回第一组匹配到的子字符串                 
((2)); // 返回2223,返回第二组匹配到的子字符串                

现在我们使用一下稍微高级点的正则匹配操作,例如有一段文本,里面有很多数字,而且这些数字是分开的,我们现在要将文本中所有数字都取出来。利用java的正则操作是那么的简单。

♨ Java代码示例:

Pattern p = ("\\d+");                                       
Matcher m = ("我的QQ是:456456 我的电话是:0532214 我的邮箱是:aaa123@");  
while (()) {                                                         
    (());                                         
}                                                                          

输出:

456456
0532214
123

如将以上 while() 循环替换成:

Pattern p = ("\\d+");                                       
Matcher m = ("我的QQ是:456456 我的电话是:0532214 我的邮箱是:aaa123@");  
while (()) {                                                         
    (());                                         
    ("start:" + ());                                
    (" end:" + ());                                 
}                                                                          

则输出:

456456
start:6 end:12
0532214
start:19 end:26
123
start:36 end:39

现在大家应该知道,每次执行匹配操作后start(),end(),group()三个方法的值都会改变,改变成匹配到的子字符串的信息,以及它们的重载方法,也会改变成相应的信息。

注意:只有当匹配操作成功,才可以使用start(),end(),group()三个方法,否则会抛出,也就是当matches(),lookingAt(),find()其中任意一个方法返回 true 时,才可以使用。