[java] jsoup 解析网页获取省市区域信息

时间:2023-03-09 23:29:37
[java] jsoup 解析网页获取省市区域信息

到国家统计局抓取数据,

[java] jsoup 解析网页获取省市区域信息

到该class下解析数据

[java] jsoup 解析网页获取省市区域信息

/**
* jsoup解析网页
* @author xwolf
* @date 2016-12-13 18:11
* @since V1.0.0
*/
public class JsoupUtil { public static JSONObject parse(String url){
JSONObject json=new JSONObject();
URL purl= null;
try {
purl = new URL(url);
Document document=Jsoup.parse(purl,1000);
Element elements=document.body();
Elements findEles= elements.getElementsByClass("MsoNormal"); for(Element ele:findEles){
Elements langSpans= ele.getElementsByAttribute("lang");
Elements nameSpans=ele.getElementsByAttribute("style");
for(int i=0;i<langSpans.size();i++){
json.put(langSpans.get(i).text().trim(),nameSpans.get(i).text().trim());
}
}
return json;
} catch (Exception e) {
e.printStackTrace();
}
return null;
} public static void main(String[] args) {
JSONObject json= parse("http://www.stats.gov.cn/tjsj/tjbz/xzqhdm/201608/t20160809_1386477.html");
System.out.println(json.toJSONString());
}

返回json,处理入库即可。

[java] jsoup 解析网页获取省市区域信息

附件:省市区域信息.zip