本节目标:
1.掌握HBase的伪分布式和完全分布式的安装与配置
2.通过HBase Shell了解HBase存储原理
3、掌握常用hbase shell命令
一、伪分布式
下载与使用的Hadoop版本匹配的HBase
本人采用Hadoop-2.7.6,HBase选择1.3.2版本,可到官网下载。
1.解压安装hbash到指定目录
2.修改环境变量:
export HBASE_HOME=/usr/local/src/hbase-1.3.2
export PATH=$PATH:$HBASE_HOME/bin
source ~/.bashrc
3.修改conf下的配置文件
hbash-env.sh
hbase-site.xml
4.启动:start-hbase.sh
伪分布式自带zookeeper,因此不能启动自己安装的zk,否则端口被占用报错。
5、进入命令行模式:hbase shell
(1)help查看帮助信息
(1)创建表
(3)查看所有表
(3)查看表描述信息
(4)写入表数据
(5)扫描表
(6)获取表数据
(7)查看名称空间
(8)删除表,先禁用表,才能删除
以上基本操作后,查看本地对数据的存储。
此时文件保存路径下没有数据写入,全部在MemStore中,需要刷新缓存后,才会落地保存。
使用命令时注意:
命令行后面不带“;”
ctrl+del往前删除
二、完全分布式搭建
基于Hadoop搭建完成HBase完全分布式搭建。
节点分布情况:
| NN | DN | JN | ZK | ZKFC | RM | NM | Master | RegionServer |
master(192.168.85.10) | l |
|
| l | l |
|
|
| l |
slave1(192.168.85.11) | l | l | l | l | l |
| l | l |
|
slave2(192.168.85.12) |
| l | l | l |
| l | l | l (backup-master) | l |
slave3(192.168.85.13) |
| l | l |
|
| l | l |
| l |
1.每个节点上解压安装hbase
2.修改环境变量(同上)
conf/hbash-env.sh
JAVA_HOME=同上
HBASE_MANAGERS_ZK=false -->不使用自带zk
hbase-site.xml
<property>
<name>hbase.rootdir</name>
<value>hdfs://HDFSHA/hbase</value>
</property>
<property>
<name>hbase.cluster.distributed</name>
<value>true</value>
</property>
<property>
<name>hbase.zookeeper.quorum</name>
<value> master,slave1,slave2 </value>
</property>
regionservers
master
slave2
slave3
vi backup-masters
4、hdfs-site.xml拷贝到conf下
5、将配置文件同步到其他节点
scp ./*
6、启动
依次启动zk,hadoop,RM,hbase
Master上启动start-hbase.sh
7、webUI检查
8.检测HA
kill -9 端口号如果单独启动一个HMaster进程:bin/hbase-daemon.sh start master
单独启动一个HRegionServer进程:bin/hbase-daemon.sh start regionserver
9、通过hbase shell简单操作,查看在HDFS上的存储情况
更多使用操作,查看官方手册。