【文件属性】:
文件名称:hadoop的经典讲义
文件大小:1.03MB
文件格式:DOC
更新时间:2017-08-24 13:55:45
hadoop
、hadoop的组成
hadoop Common – 是hadoop的核心,包括文件系统、远程调用RPC的序列化函数。
HDSF : 提供高吞吐量的可靠分布式文件系统是 GFS的开源实现。
•Hadoop的文件系统。必须通过hadoop fs 命令来读取。支持分布式。
MapReduce : 大型分布式数据处理模型,是Google MapReduce的开源实现。
•合并/计算模型。
其他相关组成:
•Hbase:结构化分部式数据库。BigTable的开源实现。
•Hive:提供摘要和查询功能的数据仓库。
•Cassandra:由Facebook开发分布式数据仓库。目前已经捐献给apache。且apache已经将Cassandra应用到了各种云计算系统中。