深入理解大数据--大数据并行处理与编程实践

时间:2018-02-22 04:29:11
【文件属性】:
文件名称:深入理解大数据--大数据并行处理与编程实践
文件大小:11.34MB
文件格式:ZIP
更新时间:2018-02-22 04:29:11
大数据分析 范例源码 《深入理解大数据:大数据处理与编程实践》在总结多年来MapReduce并行处理技术课程教学经验和成果的基础上,与业界著名企业Intel公司的大数据技术和产品开发团队和资深工程师联合,以学术界的教学成果与业界高水平系统研发经验完美结合,在理论联系实际的基础上,在基础理论原理、实际算法设计方法以及业界深度技术三个层面上,精心组织材料编写而成。 全书的主要内容包括: ■ 大数据处理技术与Hadoop MapReduce简介 ■ Hadoop系统的安装和操作管理 ■ 大数据分布式文件系统HDFS ■ Hadoop MapReduce并行编程模型、框架与编程接口 ■ 分布式数据表HBase ■ 分布式数据仓库Hive ■ Intel Hadoop系统优化与功能增强 ■ MapReduce 基础算法程序设计 ■ MapReduce高级程序设计技术 ■ MapReduce机器学习与数据挖掘基础算法 ■ 大数据处理算法与应用编程案例 这是本书很多实例的源代码 对很多进行大数据学习的朋友们会很有帮助
【文件预览】:
《深入理解大数据--大数据并行处理与编程实践》源码
----Chapter 8()
--------CH 8.4 - WordConCurrence()
--------CH 8.1 - WordCount()
--------CH 8.5 - InvertedIndexer()
--------CH 8.3 - RelationAlgebra()
--------CH 8.6 - PageRank()
--------CH 8.7 - PatentStatistics()
--------CH 8.2 - MatrixMultiply()
----Chapter 10()
--------CH 10.1 - KMeans()
--------CH 10.3 - NaiveBayes()
--------CH 10.6 - HMM_EM()
--------CH 10.5 - FreqItemSet()
--------CH 10.4 - MR_DesicionTreeBuilder()
--------CH 10.2 - KNearestNeighbour()

网友评论

  • 资料挺不错的,谢谢分享。
  • 暂时还没有用
  • s文件打开有问题
  • 东西不错的,谢谢分享啦