HBase数据模型(2)

1.0 HBase的版本version，是一个用长整型表示的。由Rowkey、Column（列族和列）、Version组合在一起称为HBase中的一个单元格。

HBase中的表数据会被分拆很多个Region，Region可以动态扩展并且HBase保证Region的负载均衡。
Region实际上是行键排序后的按则分割的连续的存储空间。
Region的自动分区动作是split和compaction
刚刚创建的的表只有一个Region，随着数据的写入，达到Region上限配置时，Region会按照中间键自动地拆分成两个大致相等的Region，每个Region由一个RegionServer管理，一个RegionServer处理器管理者许多个Region。
每个Region包含起始Rowkey的记录，不包含结束Rowkey的记录。
每个RegionServer可以管理大约100 ~ 1000个Region，每个Region的大小可以是1 ~ 20GB。
当一个Region进行拆分时，首先要将该Region下线（offline），拆分完后新的Region在上线（online），下线的Region暂时不可用，不过由于速度极快，通常不会对数据的读写造成影响。

一致性（Consistency）：所以节点在用一时间具有相同的数据。

可用性（Availability）：保证每个请求不管成功或者失败都有响应。

分区容忍性（Partition tolerance）：系统中任意信息的丢失或失败不会影响系统的继续运作。
HBase数据模型(1)
HBase数据模型(2)