当我们需要截取html里面的数据的时候,使用jsoup工具无疑是一个不错的选择,它可以根据标签的id获取得到相应的标签内容等等,反正功能蛮强大的,具体可以看看官网http://jsoup.org/
其实,这篇文章讲的如题所示:jsoup获取某种标签里面的数据
需要的jar:http://download.csdn.net/detail/u011596810/9074243
// 使用jsoup将html里面的a标签里面的数据全部读取出来(假如想读取其他标签,直接将a改为其他标签名称即可,例如"img")
Elements links = Jsoup.parse(html).select("a");
// 使用循环遍历每个标签数据
for (Iterator<Element> it = links.iterator(); it.hasNext();) {
Element e = (Element) it.next();
// 输出其text值和其属性值(可以将href改为其他属性名称,例如src)
System.out.println(e.text() + " " + e.attr("href"));
}