webharvest

时间：2015-12-27 08:17:37

【文件属性】：

文件名称：webharvest

文件大小：6.05MB

文件格式：RAR

更新时间：2015-12-27 08:17:37

webharvest xpath xquery 页面抓取例子

本例是webharvest的一个小例子，涉及xpath,xquery技术，要学习webharvest需要有xml技术基础，本例的功能是抓取页面div层的链接及链接地址

立即下载

【文件预览】：
webHarvest
----.project(1KB)
----WebContent()
--------webharvest()
--------WEB-INF()
--------index.jsp(370B)
--------META-INF()
----src()
--------com()
----.settings()
--------org.eclipse.wst.jsdt.ui.superType.container(49B)
--------org.eclipse.wst.common.project.facet.core.xml(305B)
--------org.eclipse.jdt.core.prefs(395B)
--------org.eclipse.wst.jsdt.ui.superType.name(6B)
--------org.eclipse.wst.common.component(460B)
--------.jsdtscope(503B)
----build()
--------classes()
----.classpath(668B)

网友评论

该例不错，涉及到xpath和xquery，当然实际上xml文件其实可以不用生成，在内存中生成xml，然后进行解析对数据进行处理就行。
以前用过，不过官网已经找不到了，资源不错
这个例子的结果比较简单啊，感觉并不能很好的体现要抓取的内容
暂时不是很能看的懂，在研究研究
有点简单，看不明白
这个例子也太简单了吧？也没个什么说明什么的？就抓取了个百度首页的链接地址啊！



秒客网

webharvest

网友评论

相关文章