文件名称:使用java-jsoup解析html页面内容,爬取想要的信息(如号段)
文件大小:266KB
文件格式:RAR
更新时间:2017-03-24 04:01:58
java-jsoup 解析html 爬取页面信息 号段获取
jsoup 是一款 Java 的 HTML 解析器,可直接解析某个 URL 地址、HTML 文本内容。它提供了一套非常省力的 API,可通过 DOM,CSS 以及类似于 jQuery 的操作方法来取出和操作数据。 jsoup 可以从包括字符串、URL 地址以及本地文件来加载 HTML 文档,并生成 Document 对象实例。 如:我们可以通过访问号段查询页面,获取到手机号段信息,并提取信息存储供自身的业务使用。 附件提供了详细的介绍,并通过http get请求方式抓取页面内容的java代码以及jsoup jar包。
【文件预览】:
使用java-jsoup解析html页面的内容.txt
MyTest.java
jsoup-1.7.3.jar