扩展Heritrix3指定内容提取.pdf

时间:2017-09-02 12:17:36
【文件属性】:

文件名称:扩展Heritrix3指定内容提取.pdf

文件大小:873KB

文件格式:PDF

更新时间:2017-09-02 12:17:36

heritrix3 内容提取

该文档详细介绍了如何利用heritrix3进行网页内容提取,其中内容提取模块可以自己修改,接口已经留好,具有很强的扩展性!


网友评论

  • 先收藏,以后再研究
  • 非常好的资料,谢谢
  • 可以参考,目前的相关中文参考资料十分匮乏,要珍惜
  • 有一点点参考价值吧。
  • 可以提供 templatefinder模板的具体代码马吗?