基于Hadoop平台实现一个分布式网络爬虫

时间:2018-03-02 11:08:14
【文件属性】:

文件名称:基于Hadoop平台实现一个分布式网络爬虫

文件大小:2.31MB

文件格式:PDF

更新时间:2018-03-02 11:08:14

Hadoop 分布式 网络爬虫

基于Hadoop实现一个分布式网络爬虫系统的理论描述


网友评论

  • 不错资源,值得学习
  • 文档不错,有代码就更好了
  • 论文写的很不错,要是能分享一下源码就更好了
  • 布隆过滤器很新颖,论文中没有提到反网站反爬虫机制的策略,另外,只是用学院的网站做了测试,代表性不强。
  • 很不错的资源,非常值得,谢谢分享