Jsoup爬取360电影网上的信息

时间:2022-06-24 12:23:21

跟我上一篇写的博客差不多,就不在多说了,直接贴上java代码了

package com.xiedong.Jsoup;



import java.io.IOException;
import java.util.ArrayList;
import java.util.List;

import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;

/**
* @author 谢栋
* @data 2016年3月24日 下午8:52:33
*/
public class Parsre_html {

public static void main(String[] args) throws Exception {
// TODO Auto-generated method stub

article();
}

public static void article1() throws Exception
{
Document doc=Jsoup.connect("http://www.360kan.com/").get();



Elements listClass=doc.getElementsByAttributeValue("class", "eb-nav-item js-ebnav");

for(Element ListElement : listClass)
{
Elements listName =ListElement.getElementsByTag("a");

for(Element element : listName )
{
//得到的是一个节点值 <a href="http://www.360kan.com" target="_self" class="eb-nav-link current">首页</a>
System.out.println(element.getElementsByAttribute("href"));
//得到的是里面的内容 http://www.360kan.com
System.out.println(element.attr("href"));


System.out.println(element.text().trim());
}
}
}



public static void article() {
Document doc;
try {
doc = Jsoup.connect("http://www.360kan.com/").get();


Elements listClass=doc.getElementsByAttributeValue("class", "b-topslider-item js-g-slide-item g-slide-item");

for(Element listElement : listClass)
{
Elements listName=listElement.getElementsByTag("a");
for(Element element :listName)
{
String href=element.attr("href");
String text=element.text().trim();

System.out.println(href);
System.out.println(text);
}
}
} catch (IOException e) {
// TODO Auto-generated catch block
e.printStackTrace();
}

}




}