Hadoop,zookeeper,hbase之间的关系

时间:2024-05-30 15:55:12

hbase篇

Hbase是一个面向列族的存储器,即Hbase在存储的时候将所有的列族成员都一起放在HDFS中存储,存储图片的数据比较大,图片的元数据比较少,所以分成两个列族来储存。Hadoop,zookeeper,hbase之间的关系
上图为Hbase数据模型,键值都是序列化的二进制,并且行根据键的二进制排序。区域是hbase在集群上分布数据的最小单位(区域就是一个表的连续n行)
和HDFS类似,Hbase有一个master和n个regionserver,Hbase的master把区域分给regionserver,恢复regionserver的故障,regionserver负责区域的管理及读写要求。
Hbase依赖于Zookeeper,zookeeper管理hbase:meta目录表的位置等重要信息,以及当服务器崩溃时,区域的分配协调。