webharvest

时间:2015-12-27 08:17:37
【文件属性】:

文件名称:webharvest

文件大小:6.05MB

文件格式:RAR

更新时间:2015-12-27 08:17:37

webharvest xpath xquery 页面抓取 例子

本例是webharvest的一个小例子,涉及xpath,xquery技术,要学习webharvest需要有xml技术基础,本例的功能是抓取页面div层的链接及链接地址


【文件预览】:
webHarvest
----.project(1KB)
----WebContent()
--------webharvest()
--------WEB-INF()
--------index.jsp(370B)
--------META-INF()
----src()
--------com()
----.settings()
--------org.eclipse.wst.jsdt.ui.superType.container(49B)
--------org.eclipse.wst.common.project.facet.core.xml(305B)
--------org.eclipse.jdt.core.prefs(395B)
--------org.eclipse.wst.jsdt.ui.superType.name(6B)
--------org.eclipse.wst.common.component(460B)
--------.jsdtscope(503B)
----build()
--------classes()
----.classpath(668B)

网友评论

  • 该例不错,涉及到xpath和xquery,当然实际上xml文件其实可以不用生成,在内存中生成xml,然后进行解析对数据进行处理就行。
  • 以前用过,不过官网已经找不到了,资源不错
  • 这个例子的结果比较简单啊,感觉并不能很好的体现要抓取的内容
  • 暂时不是很能看的懂,在研究研究
  • 有点简单,看不明白
  • 这个例子也太简单了吧?也没个什么说明什么的?就抓取了个百度首页的链接地址啊!