jsoup抓取某网站关键字查询列表的所有文章,并生成文档

时间:2021-12-24 10:21:14
【文件属性】:

文件名称:jsoup抓取某网站关键字查询列表的所有文章,并生成文档

文件大小:18KB

文件格式:RAR

更新时间:2021-12-24 10:21:14

maven jsoup 爬虫 java

前两天因为一个业务需求,需要从某网站爬取某个关键字搜索结果的所有文章,于是加班做了一个基于jsoup的爬虫程序,可以将特定关键字的搜索结果里所有的文章爬取到,并以文件的形式保存到本地,支持分页爬取。完整项目代码,有需要的可以下载,共同研究。


【文件预览】:
JavaSpider
----bin()
--------com()
----pom.xml(545B)
----target()
--------test-classes()
--------JavaSpider-1.0.1.jar(1KB)
--------classes()
--------maven-archiver()
----.settings()
--------org.eclipse.m2e.core.prefs(90B)
--------org.eclipse.wst.common.project.facet.core.xml(226B)
--------org.eclipse.core.resources.prefs(95B)
--------org.eclipse.jdt.core.prefs(664B)
----src()
--------com()
----.project(768B)
----.classpath(598B)
----lib()

网友评论