++++++++ 求正则表达式:怎么取得和之间的字符串 ++++++++

时间:2021-08-21 18:50:02
求正则表达式:怎么取得<a href="xxxxxx">和</a>之间的字符串?

比如:<a href="xxxxxx">北京海淀区颐和园</a>,就取‘北京海淀区颐和园’,其它不要。

xxxxxx为网址,可能带参数

请各位老大给一个可用的算法,谢谢

9 个解决方案

#1


一定要用正则表达式提取吗?取 > 和 < 之间的内容啊。


如果用正则表达式擦掉 < 和 > 这件的内容,那么剩下的也行啊。
另外,构造一个xml,然后提取节点 a 的内容,也是可以的嘛。

#2


一定要用正则了,你有什么高招吗?

#3


public static void main(String[] args)
    {
        Untitled2 u = new Untitled2();
        String testString = "<a href=\"http://www.com.cn/a/b.jsp?name=value\">北京海淀区颐和园</a>";
        String r = testString.replaceAll("^<a.*\\\"\\s*>|</a>$","");
        System.out.println(r);
    }

#4


这个链接最规则了,应该很好取的,匹配表达式如下
<a\\s+href\\s*=(\\s*(\"[^\"]*\"|[^\\s>])[^>]*)>([^<]*)</a>
想取什么自己去相应的组中取吧

#5


public static void main(String[] args)
{
String reg="<[^>]*>([^<]*)<[^>]*>";
Pattern pattern=Pattern.compile(reg);
String s="<a href=\"xxxxxx\">北京海淀区颐和园</a>";
Matcher matcher=pattern.matcher(s);
while(matcher.find())
{
System.out.print(matcher.group(1));
}
}

#6


通过抗干扰测试,好像还是这样好点:

    public static void main(String[] args)
    {
        String testString = "<a href=\"http://www.com.cn/a/b.jsp?name=value\">><北京海淀区颐和园</a>";
        Pattern p = Pattern.compile("<[^>]*>(.*)</[^>]*>");
        Matcher m = p.matcher(testString);
        while (m.find())
        {
            System.out.println(m.group(1));
        }
    }

#7


谢谢 我试一下

#8


String testString = "<a href=\"http://www.com.cn/a/b.jsp?name=value\">北京海淀区颐和园</a>";
 String regExp2 ="(<a\\s+href\\s*=(\\s*(\"[^\"]*\"|[^\\s>])[^>]*)>([^<]*))(.*)(</a>)";
  r = testString.replaceAll(regExp2,"$4");
  System.out.println(r);

#9


<[aA].*?>|<[/][aA]>

#1


一定要用正则表达式提取吗?取 > 和 < 之间的内容啊。


如果用正则表达式擦掉 < 和 > 这件的内容,那么剩下的也行啊。
另外,构造一个xml,然后提取节点 a 的内容,也是可以的嘛。

#2


一定要用正则了,你有什么高招吗?

#3


public static void main(String[] args)
    {
        Untitled2 u = new Untitled2();
        String testString = "<a href=\"http://www.com.cn/a/b.jsp?name=value\">北京海淀区颐和园</a>";
        String r = testString.replaceAll("^<a.*\\\"\\s*>|</a>$","");
        System.out.println(r);
    }

#4


这个链接最规则了,应该很好取的,匹配表达式如下
<a\\s+href\\s*=(\\s*(\"[^\"]*\"|[^\\s>])[^>]*)>([^<]*)</a>
想取什么自己去相应的组中取吧

#5


public static void main(String[] args)
{
String reg="<[^>]*>([^<]*)<[^>]*>";
Pattern pattern=Pattern.compile(reg);
String s="<a href=\"xxxxxx\">北京海淀区颐和园</a>";
Matcher matcher=pattern.matcher(s);
while(matcher.find())
{
System.out.print(matcher.group(1));
}
}

#6


通过抗干扰测试,好像还是这样好点:

    public static void main(String[] args)
    {
        String testString = "<a href=\"http://www.com.cn/a/b.jsp?name=value\">><北京海淀区颐和园</a>";
        Pattern p = Pattern.compile("<[^>]*>(.*)</[^>]*>");
        Matcher m = p.matcher(testString);
        while (m.find())
        {
            System.out.println(m.group(1));
        }
    }

#7


谢谢 我试一下

#8


String testString = "<a href=\"http://www.com.cn/a/b.jsp?name=value\">北京海淀区颐和园</a>";
 String regExp2 ="(<a\\s+href\\s*=(\\s*(\"[^\"]*\"|[^\\s>])[^>]*)>([^<]*))(.*)(</a>)";
  r = testString.replaceAll(regExp2,"$4");
  System.out.println(r);

#9


<[aA].*?>|<[/][aA]>