开源WebHarvest抓取实例

时间:2014-11-17 08:57:27
【文件属性】:

文件名称:开源WebHarvest抓取实例

文件大小:5KB

文件格式:RAR

更新时间:2014-11-17 08:57:27

抓取 WebHarvest XQuery Xpath xml例子

1. template目录下的三个模板分别是 sina_1. 抓取全网财经要闻-新浪(一条新闻) sina_2. 抓取主流财经网站要闻区-新浪(列表新闻) sina_3. 抓取最新访谈-新浪(图文混合) sina_3_img 保存了图文混合的图片 2. 实例采用了XQuery表达式[loop、concat()、substring-after()、indexOf()等],XPath表达式[