Hadoop-2.4.0+Hbase-0.94.18+Nutch-2.3集群爬虫配置攻略

时间:2018-01-12 09:39:35
【文件属性】:

文件名称:Hadoop-2.4.0+Hbase-0.94.18+Nutch-2.3集群爬虫配置攻略

文件大小:20KB

文件格式:DOCX

更新时间:2018-01-12 09:39:35

hbaes,nutch

使用github中最新的nutch-2.x源码,奋战10天拿下的Hadoop-2.4.0+Hbase-0.94.18+Nutch-2.3配置攻略,在ubuntu14.04上成功运行本地和分布式爬虫。文档详细描述了三者版本不兼容问题的解决方案以及各个配置文件的详细配置。忠诚奉献给各位,如果有什么问题,请留言!


网友评论

  • 太垃圾了,不要下载!我分享自己搭的吧http://note.youdao.com/noteshare?id=17a2083f2098e5885e5204df0fcff795
  • 谢谢 很有用,刚搭建好了hadoop hbase 正缺nutch
  • 分好高啊,但是鉴于资源比较少,还是忍痛下了,还不错
  • 很有帮助,解决了问题
  • 对我没什么用,分有点高了,,不知道有没有做过mongodb做存储的配置,在eclipse下运行和部署运行会遇到各种不同的问题,。。
  • 还不错,文档说的只是做啊做,为啥做如果写了就更好了。