文件名称:开源WebHarvest抓取实例
文件大小:5KB
文件格式:RAR
更新时间:2014-11-17 08:57:27
抓取 WebHarvest XQuery Xpath xml例子
1. template目录下的三个模板分别是
sina_1. 抓取全网财经要闻-新浪(一条新闻)
sina_2. 抓取主流财经网站要闻区-新浪(列表新闻)
sina_3. 抓取最新访谈-新浪(图文混合)
sina_3_img 保存了图文混合的图片
2. 实例采用了XQuery表达式[loop、concat()、substring-after()、indexOf()等],XPath表达式[、
【文件预览】:
sina_3.xml
sina_2.xml
details.xml
sina_1.xml
sina_3_img.xml