【HBase一】HBase概述

1. Hadoop生态系统

【HBase一】HBase概述

底层是存储(HDFS),上层是计算框架
从图中可以看出，Hive、Pig和Mahout是基于MapReduce的计算框架，分别用于结构化数据的即席查询，数据流处理以及基于MapReduce的机器学习算法集
HBase依赖于HDFS，HBase这个圆角矩形框在高度上= MapReduce + 基于MapReduce的计算框架，这是不是说，HBase一部分是跟MapReduce平级，属于基础框架级，同时又提供了应用级的能力

HBase是基于Apache Hadoop的面向列的NoSQL数据库，是Google的BigTable的开源实现。
HBase是一个针对结构化数据的开源的、多版本的、可伸缩、高可靠、高性能、分布式和面向列的动态模式数据库。和传统关系数据库不同，HBase采用了BigTable的数据模型：增强的稀疏排序映射表（Key/Value），其中，键由行关键字、列关键字和时间戳构成。
HBase提供了对大规模数据的随机、实时读写访问
HBase的目标是存储并处理大型的数据，更具体地说仅用普通的硬件配置，能够处理上千亿的行和几百万的列所组成的超大型数据库。
HBase是一个开源的、分布式的、多版本的、面向列的存储模型。可以直接使用本地文件系统也可使用Hadoop的HDFS文件存储系统。
HBase中保存的数据可以使用MapReduce来处理，它将数据存储和并行计算完美地结合在一起。
HBase具有"向下提供存储，向上提供运算"的特点，这跟上图就对应起来了，比如Hive on HBase，即HBase为Hive计算提供输入数据
HBase数据模型：Schema-->Table-->Column Family-->Column-->RowKey-->TimeStamp-->Value
从逻辑上讲，HBase将数据按照表、行和列进行存储

【HBase一】HBase概述

【HBase一】HBase概述
行存储的特点：

【HBase一】HBase概述
列存储的特点：