网络爬虫heritrix

时间:2014-07-10 05:01:55
【文件属性】:

文件名称:网络爬虫heritrix

文件大小:3.7MB

文件格式:PDF

更新时间:2014-07-10 05:01:55

heritrix

Heritrix is the Internet Archive′s open-source, extensible, web-scale, archival-quality web crawler project. Heritrix是互联网档案馆的开放源码的,可扩展,网络规模,档案质量的网络爬虫项目。


网友评论

  • 好资料,值得看一下
  • 很好,不错!值得学一学!
  • 好文章,有参考价值,论文写的不错