网络爬虫资源包及使用教程

时间:2017-03-29 11:39:57
【文件属性】:

文件名称:网络爬虫资源包及使用教程

文件大小:422KB

文件格式:RAR

更新时间:2017-03-29 11:39:57

jsoup 网络爬虫

Java 程序在解析HTML 文档时,相信大家都接触过htmlparser 这个开源项目,我曾经在IBM DW 上发表过两篇关于htmlparser 的文章,分别是:从HTML中攫取你所需的信息 和扩展HTMLParser 对自定义标签的处理能力。但现在我已经不再使用htmlparser 了,原因是htmlparser 很少更新,但最重要的是有了jsoup 。 jsoup 是一款Java 的HTML解析器,可直接解析某个URL地址、HTML文本内容。它提供了一套非常省力的API,可通过DOM,CSS以及类似于jQuery的操作方法来取出和操作数据。


【文件预览】:
jsoup教程.pdf
jsoup-1.7.1.jar
网络爬虫源代码.txt

网友评论

  • 好 可以使用 没有问题
  • 挺全的,刚入门。很有用
  • 非常棒诶!跑了一下很好用的样子~