Hadoop权威指南(中文)

时间:2016-06-12 13:40:29
【文件属性】:

文件名称:Hadoop权威指南(中文)

文件大小:23.38MB

文件格式:PDF

更新时间:2016-06-12 13:40:29

Hadoop

学习Hadoop的必备中文资料 基本组成 Hadoop-0.20.0 以前 Core---- 一系列分布式文件系统和通用 I/O 的组件和接口(序列化、 Java RPC 和 持久化数据结构) Avro---- 一种提供高效、跨语言 PRC 的数据序列化系统,持久化数据存储。 MapReduce---- 分布式数据处理模式和执行环境,运行于大型商用机集群; HDFS---- 分布式文件系统,运行于大型商用机集群; ZooKeeper---- 一个分布式的、高可用性的协调服务; Pig---- 一 种 数 据 流 语 言 和 运 行 环 境 , 用 以 检 索 非 常 大 的 数 据 集 , 运 行 在 MapReduce 和 HDFS 集群上; Chukwa------ 分布式数据收集和分析系统; Hive--- 分布式数据仓库, Hive 管理 HDFS 中存储的数据, 并提供基于 SQL 的查询 语言用以查询数据; Hbase---- - 一个分布式的、列存储数据库。 HBase 使用 HDFS 作为底层存储,同时 支持 MapReduce 的批量式计算和点查询


网友评论