文件名称:WebCollector+Selenium+Phantomjs
文件大小:51KB
文件格式:ZIP
更新时间:2018-11-16 12:31:27
Java爬虫 WebCollector selenium phantomjs
爬虫简介: WebCollector是一个无须配置、便于二次开发的JAVA爬虫框架(内核),它提供精简的的API,只需少量代码即可实现一个功能强大的爬虫。 爬虫内核: WebCollector致力于维护一个稳定、可扩的爬虫内核,便于开发者进行灵活的二次开发。内核具有很强的扩展性,用户可以在内核基础上开发自己想要的爬虫。源码中集成了Jsoup,可进行精准的网页解析。2.x版本中集成了selenium,可以处理javascript生成的数据。
【文件预览】:
WebCollectorDemo
----.project(2KB)
----.mymetadata(321B)
----src()
--------test()
--------main()
----target()
--------m2e-jee()
--------test-classes()
----WebRoot()
--------WEB-INF()
--------index.jsp(834B)
--------META-INF()
----.myeclipse()
----.settings()
--------org.eclipse.wst.jsdt.ui.superType.container(49B)
--------org.eclipse.jdt.ui.prefs(6KB)
--------org.eclipse.wst.common.project.facet.core.xml(252B)
--------org.eclipse.m2e.core.prefs(121B)
--------org.eclipse.jdt.core.prefs(461B)
--------org.eclipse.wst.jsdt.ui.superType.name(6B)
--------com.genuitec.eclipse.j2eedt.core.prefs(87B)
--------org.eclipse.core.resources.prefs(149B)
--------org.eclipse.wst.common.component(585B)
--------.jsdtscope(500B)
----phantomjsdriver.log(45KB)
----pom.xml(2KB)
----.classpath(712B)