文件名称:jsoup抓取某网站关键字查询列表的所有文章,并生成文档
文件大小:18KB
文件格式:RAR
更新时间:2021-12-24 10:21:14
maven jsoup 爬虫 java
前两天因为一个业务需求,需要从某网站爬取某个关键字搜索结果的所有文章,于是加班做了一个基于jsoup的爬虫程序,可以将特定关键字的搜索结果里所有的文章爬取到,并以文件的形式保存到本地,支持分页爬取。完整项目代码,有需要的可以下载,共同研究。
【文件预览】:
JavaSpider
----bin()
--------com()
----pom.xml(545B)
----target()
--------test-classes()
--------JavaSpider-1.0.1.jar(1KB)
--------classes()
--------maven-archiver()
----.settings()
--------org.eclipse.m2e.core.prefs(90B)
--------org.eclipse.wst.common.project.facet.core.xml(226B)
--------org.eclipse.core.resources.prefs(95B)
--------org.eclipse.jdt.core.prefs(664B)
----src()
--------com()
----.project(768B)
----.classpath(598B)
----lib()