跟我上一篇写的博客差不多,就不在多说了,直接贴上java代码了
package com.xiedong.Jsoup;
import java.io.IOException;
import java.util.ArrayList;
import java.util.List;
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;
/**
* @author 谢栋
* @data 2016年3月24日 下午8:52:33
*/
public class Parsre_html {
public static void main(String[] args) throws Exception {
// TODO Auto-generated method stub
article();
}
public static void article1() throws Exception
{
Document doc=Jsoup.connect("http://www.360kan.com/").get();
Elements listClass=doc.getElementsByAttributeValue("class", "eb-nav-item js-ebnav");
for(Element ListElement : listClass)
{
Elements listName =ListElement.getElementsByTag("a");
for(Element element : listName )
{
//得到的是一个节点值 <a href="http://www.360kan.com" target="_self" class="eb-nav-link current">首页</a>
System.out.println(element.getElementsByAttribute("href"));
//得到的是里面的内容 http://www.360kan.com
System.out.println(element.attr("href"));
System.out.println(element.text().trim());
}
}
}
public static void article() {
Document doc;
try {
doc = Jsoup.connect("http://www.360kan.com/").get();
Elements listClass=doc.getElementsByAttributeValue("class", "b-topslider-item js-g-slide-item g-slide-item");
for(Element listElement : listClass)
{
Elements listName=listElement.getElementsByTag("a");
for(Element element :listName)
{
String href=element.attr("href");
String text=element.text().trim();
System.out.println(href);
System.out.println(text);
}
}
} catch (IOException e) {
// TODO Auto-generated catch block
e.printStackTrace();
}
}
}