Hadoop权威指南(第2版)中文版

时间:2015-02-28 05:06:33
【文件属性】:

文件名称:Hadoop权威指南(第2版)中文版

文件大小:23.34MB

文件格式:PDF

更新时间:2015-02-28 05:06:33

Hadoop 权威指南 第2版 中文版

《hadoop权威指南(第2版)》从hadoop的缘起开始,由浅入深,结合理论和实践,全方位地介绍hadoop这一高性能处理海量数据集的理想工具。全书共16章,3个附录,涉及的主题包括:haddoop简介;mapreduce简介;hadoop分布式文件系统;hadoop的i/o、 mapreduce应用程序开发;mapreduce的工作机制;mapreduce的类型和格式;mapreduce的特性;如何构建hadoop集群,如何管理hadoop;pig简介;hbase简介;hive简介;zookeeper简介;开源工具sqoop,最后还提供了丰富的案例分析。   《hadoop权威指南(第2版)》是hadoop权威参考,程序员可从中探索如何分析海量数据集,管理员可以从中了解如何安装与运行hadoop集群。    google帝国的基石是什么?mapreduce算法!开源项目hadoop作为它的一个具体实现,可以轻松用于构建和维护一个可靠性高、伸缩性强的分布式系统。   作者tomwhite作为hadoop的项目负责人,通过自己对hadoop和hadoop社区的理解,化繁为简,用浅显易懂的语言介绍了hadoop能做什么,怎么做才能充分发挥hadoop的优势,hadoop能够和哪些开源工具结合使用。这是一本主题丰富、讲解透彻的权威参考书,可帮助程序员了解分析海量数据集的细枝末节,帮助管理员掌握搭建和运行hadoop集群的具体过程。   经过修订和更新的第2版概述了hadoop的最新动态,例如hive、sqoop和avro等。书中还提供了案例分析来帮助读者了解如何用hadoop来解决具体的问题。如果想充分利用数据,从中挖掘出有价值的见解或者观点,毫无疑问,这本书将是您不可或缺的重要参考。   使用hadoop分布式文件系统(hdfs)来存储大型数据集,然后用mapreduce对这些数据集执行分布式计算    hadoop的数据和i/o构建块(用子压缩、数据完整性、序列化和持久处理)   探究mapreducc应用开发中常见的陷阱和高级特性   设计,构建和管理门adoop专用集群或在云上运行hadoop   使用pig这种高级的查询语言来进行大规模数据处理   使用hive(hadoop的数据仓库系统)来分析数据集   使用hbase(hadoop的……


网友评论

  • 刚刚看了前两章,感觉很不错。
  • 不错,可惜是扫描的
  • 刚刚看了前两章,感觉很不错。
  • 一部很经典的教材 受益匪浅
  • 不错的一本书,对于初学者入门很好
  • 感谢楼主分享,是一本Hadoop权威入门的书。
  • 经典的入门书籍 个人建议结合hadoop源码 更容易理解
  • 不错不错,感谢分享!
  • 文字清晰,有标签页
  • 很不错的入门书籍
  • 是我想要的书,不错
  • 还可以,就是不太清楚
  • 文字清晰,有标签页,总体来说不错
  • 终于看完了,比较权威的书
  • 不错,对实践具有非常强大的指导意义
  • 是本经典的入门书籍,找了好久,感谢分享。
  • 是完整的hadoop书,是我要找的,很经典,也没什么错误,多谢楼主
  • 是我想要的书,多谢分享
  • 讲的很浅,很好的入门书籍
  • 真的是很好的学习工作参考书籍
  • 好东西,很不错,用处很大。感谢分享。
  • 非常好的入门书籍,谢谢
  • 很好的资源,由浅入深
  • 很好的资源,由浅入深,hadoop入门必备~
  • 经典书籍,果断入手