https://www.cnblogs.com/ejiyuan/p/5591613.html
HBase简介
HBase是Apache Hadoop中的一个子项目,是一个HBase是一个开源的、分布式的、多版本的、面向列的、非关系(NoSQL)的、可伸缩性分布式数据存储模型,Hbase依托于Hadoop的HDFS作为最基本存储基础单元。HBase的服务器体系结构遵从简单的主从服务器架构,它由HRegion Server群和HMaster Server构成。HMaster Server负责管理所有的HRegion Server,而HBase中的所有Server都是通过Zookeeper进行的分布式信息共享与任务协调的工作。HMaster Server本身并不存储HBase中的任何数据,HBase逻辑上的表可能会被划分成多个Region,然后存储到HRegionServer群中,HRegionServer响应用户I/O请求,向HDFS文件系统中读写数据。HBase Master Server中存储的是从数据到HRegion Server的映射。
下面一幅图是Hbase在Hadoop Ecosystem中的位置
上图描述了Hadoop EcoSystem中的各层系统,其中HBase位于结构化存储层,Hadoop HDFS为HBase提供了高可靠性的底层存储支持,Hadoop MapReduce为HBase提供了高性能的计算能力,Zookeeper为HBase提供了稳定服务和failover机制。 此外,Pig和Hive还为HBase提供了高层语言支持,使得在HBase上进行数据统计处理变的非常简单。 Sqoop则为HBase提供了方便的RDBMS数据导入功能,使得传统数据库数据向HBase中迁移变的非常方便。
1,系统环境配置
- 安装hadoop
- 安装zookeeper
2,下载与安装:
- Hbase 版本必需 与 Hadoop 版本匹配,否则会安装失败或不能正常使用。关于两者何种版本能正常匹配,可以看官方文档查看 hbase 官方文档(http://hbase.apache.org/book.html#basic.prerequisites),找到与 hadoop 版本对应的 hbase 并下载(http://archive.apache.org/dist/hbase/)
- 使用tar解压hbase
123
cd /usr/local
tar -zxvf hbase-1.2.1-bin.tar.gz
mv /home/hbase
- 使用vi /etc/profile设置环境变量
3,系统参数配置
配置工作具体如下:
- 使用 vi /home/hbase/conf/hbase-env.sh 修改系统环境
123
export JAVA_HOME=/usr/local/jdk1.
8
export HBASE_PID_DIR=/home/hbase/pid #使用mkdir /home/hbase/pid命令先创建
export HBASE_MANAGES_ZK=
false
#不适用内置zookeeper,使用我们自己安装的(具体指定使用哪个zookeeper是通过/etc/profile中的ZK_HOME变量来指定的)
- vi conf/hbase-site.xml 配置系统参数
<configuration>
<property>
<name>hbase.rootdir</name>
<value>hdfs://master:9000/hbase</value>
<description>设置 hbase 数据库存放数据的目录,这里是放在hadoop hdfs上,这里要与hadoop的core-site.xml文件中的fs.default.name中的值一致,然后在后面添加自己的子目录,我这里定义是hbase</description>
</property>
<property>
<name>hbase.cluster.distributed</name>
<value>true</value>
<description>打开 hbase 分布模式</description>
</property>
<property>
<name>hbase.master</name>
<value>master</value>
<description>指定 hbase 集群主控节点</description>
</property>
<property>
<name>hbase.tmp.dir</name>
<value>/home/user/tmp/hbase</value>
<description>hbase的一些临时文件存放目录。</description>
</property>
<property>
<name>hbase.zookeeper.quorum</name>
<value>master,slave1,slave2</value>
<description> 指定 zookeeper 集群节点名 , 因为是由 zookeeper 表决算法决定的</description>
</property>
<property>
<name>hbase.zookeeper.property.clientPort</name>
<value>2181</value>
<description> 连接到zookeeper的端口,默认是2181</description>
</property>
</configuration> - vi conf/regionservers 该文件指定了HRegionServer进程将在哪些节点上运行
msater
slave1
slave2
- 向其他节点传递安装,使用下列命令
12
scp /home/hbase root
@slave1
:/home/
scp /home/hbase root
@slave2
:/home/
完成后使用vi /etc/profile 设置各自节点的环境变量
4,启动hbase服务
启动hbase前要确保,hadoop,zookeeper已经启动,进入$HBASE_HOME/bin目录下,输入命令start-hbase.sh
执行jps查看系统进程
其他节点
启动日志会输出到/home/hbase/logs/hbase-root-master-master.log中,可以查看排除异常
5,测试
启动完成后,执行如下命令可以进入到hbase shell界面,使用命令status检查集群节点状态
这里可以使用 hbase shell命令执行数据库操作,具体参考 http://www.cnblogs.com/nexiyi/p/hbase_shell.html
另外也可以直接打开网址:http://192.168.137.122:16010/master-status,在web中查看集群状态,其中192.168.137.122是master所在节点的IP,16010为hbase默认端口(老版本中为60010)
6,错误
本次安装测试中主要出现了一下几个错误:
- 各节点节点时间不一致
1234567891011
org.apache.hadoop.hbase.ClockOutOfSyncException: org.apache.hadoop.hbase.ClockOutOfSyncException: Server hadoopslave2,
60020
,
1372320861420
has been rejected; Reported time is too far out of sync with master. Time difference of 143732ms > max allowed of 30000ms
at sun.reflect.NativeConstructorAccessorImpl.newInstance0(Native Method)
at sun.reflect.NativeConstructorAccessorImpl.newInstance(NativeConstructorAccessorImpl.java:
57
)
at sun.reflect.DelegatingConstructorAccessorImpl.newInstance(DelegatingConstructorAccessorImpl.java:
45
)
at java.lang.reflect.Constructor.newInstance(Constructor.java:
525
)
at org.apache.hadoop.ipc.RemoteException.instantiateException(RemoteException.java:
95
)
at org.apache.hadoop.ipc.RemoteException.unwrapRemoteException(RemoteException.java:
79
)
at org.apache.hadoop.hbase.regionserver.HRegionServer.reportForDuty(HRegionServer.java:
2093
)
at org.apache.hadoop.hbase.regionserver.HRegionServer.run(HRegionServer.java:
744
)
at java.lang.Thread.run(Thread.java:
722
)
Caused by: org.apache.hadoop.ipc.RemoteException: org.apache.hadoop.hbase.ClockOutOfSyncException: Server hadoopslave2,
60020
,
1372320861420
has been rejected; Reported time is too far out of sync with master. Time difference of 143732ms > max allowed of 30000ms
在各节点的hbase-site.xml文件中加入下列代码
<property>
<name>hbase.master.maxclockskew</name>
<value>200000</value>
</property> - Directory is not empty
1234567891011121314151617181920212223242526272829303132333435363738394041424344454647484950515253545556
org.apache.hadoop.ipc.RemoteException(org.apache.hadoop.fs.PathIsNotEmptyDirectoryException): `/hbase/WALs/slave1,
16000
,
1446046595488
-splitting is non empty': Directory is not empty
at org.apache.hadoop.hdfs.server.namenode.FSNamesystem.deleteInternal(FSNamesystem.java:
3524
)
at org.apache.hadoop.hdfs.server.namenode.FSNamesystem.deleteInt(FSNamesystem.java:
3479
)
at org.apache.hadoop.hdfs.server.namenode.FSNamesystem.delete(FSNamesystem.java:
3463
)
at org.apache.hadoop.hdfs.server.namenode.NameNodeRpcServer.delete(NameNodeRpcServer.java:
751
)
at org.apache.hadoop.hdfs.protocolPB.ClientNamenodeProtocolServerSideTranslatorPB.delete(ClientNamenodeProtocolServerSideTranslatorPB.java:
562
)
at org.apache.hadoop.hdfs.protocol.proto.ClientNamenodeProtocolProtos$ClientNamenodeProtocol$
2
.callBlockingMethod(ClientNamenodeProtocolProtos.java)
at org.apache.hadoop.ipc.ProtobufRpcEngine$Server$ProtoBufRpcInvoker.call(ProtobufRpcEngine.java:
585
)
at org.apache.hadoop.ipc.RPC$Server.call(RPC.java:
928
)
at org.apache.hadoop.ipc.Server$Handler$
1
.run(Server.java:
2013
)
at org.apache.hadoop.ipc.Server$Handler$
1
.run(Server.java:
2009
)
at java.security.AccessController.doPrivileged(Native Method)
at javax.security.auth.Subject.doAs(Subject.java:
415
)
at org.apache.hadoop.security.UserGroupInformation.doAs(UserGroupInformation.java:
1614
)
at org.apache.hadoop.ipc.Server$Handler.run(Server.java:
2007
)
at org.apache.hadoop.ipc.Client.call(Client.java:
1411
)
at org.apache.hadoop.ipc.Client.call(Client.java:
1364
)
at org.apache.hadoop.ipc.ProtobufRpcEngine$Invoker.invoke(ProtobufRpcEngine.java:
206
)
at com.sun.proxy.$Proxy15.delete(Unknown Source)
at org.apache.hadoop.hdfs.protocolPB.ClientNamenodeProtocolTranslatorPB.delete(ClientNamenodeProtocolTranslatorPB.java:
490
)
at sun.reflect.GeneratedMethodAccessor7.invoke(Unknown Source)
at sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:
43
)
at java.lang.reflect.Method.invoke(Method.java:
606
)
at org.apache.hadoop.io.retry.RetryInvocationHandler.invokeMethod(RetryInvocationHandler.java:
187
)
at org.apache.hadoop.io.retry.RetryInvocationHandler.invoke(RetryInvocationHandler.java:
102
)
at com.sun.proxy.$Proxy16.delete(Unknown Source)
at sun.reflect.GeneratedMethodAccessor7.invoke(Unknown Source)
at sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:
43
)
at java.lang.reflect.Method.invoke(Method.java:
606
)
at org.apache.hadoop.hbase.fs.HFileSystem$
1
.invoke(HFileSystem.java:
279
)
at com.sun.proxy.$Proxy17.delete(Unknown Source)
at sun.reflect.GeneratedMethodAccessor7.invoke(Unknown Source)
at sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:
43
)
at java.lang.reflect.Method.invoke(Method.java:
606
)
at org.apache.hadoop.hbase.fs.HFileSystem$
1
.invoke(HFileSystem.java:
279
)
at com.sun.proxy.$Proxy17.delete(Unknown Source)
at org.apache.hadoop.hdfs.DFSClient.delete(DFSClient.java:
1726
)
at org.apache.hadoop.hdfs.DistributedFileSystem$
11
.doCall(DistributedFileSystem.java:
588
)
at org.apache.hadoop.hdfs.DistributedFileSystem$
11
.doCall(DistributedFileSystem.java:
584
)
at org.apache.hadoop.fs.FileSystemLinkResolver.resolve(FileSystemLinkResolver.java:
81
)
at org.apache.hadoop.hdfs.DistributedFileSystem.delete(DistributedFileSystem.java:
584
)
at org.apache.hadoop.hbase.master.SplitLogManager.splitLogDistributed(SplitLogManager.java:
297
)
at org.apache.hadoop.hbase.master.MasterFileSystem.splitLog(MasterFileSystem.java:
400
)
at org.apache.hadoop.hbase.master.MasterFileSystem.splitLog(MasterFileSystem.java:
373
)
at org.apache.hadoop.hbase.master.MasterFileSystem.splitLog(MasterFileSystem.java:
295
)
at org.apache.hadoop.hbase.master.procedure.ServerCrashProcedure.splitLogs(ServerCrashProcedure.java:
388
)
at org.apache.hadoop.hbase.master.procedure.ServerCrashProcedure.executeFromState(ServerCrashProcedure.java:
228
)
at org.apache.hadoop.hbase.master.procedure.ServerCrashProcedure.executeFromState(ServerCrashProcedure.java:
72
)
at org.apache.hadoop.hbase.procedure2.StateMachineProcedure.execute(StateMachineProcedure.java:
119
)
at org.apache.hadoop.hbase.procedure2.Procedure.doExecute(Procedure.java:
452
)
at org.apache.hadoop.hbase.procedure2.ProcedureExecutor.execProcedure(ProcedureExecutor.java:
1050
)
at org.apache.hadoop.hbase.procedure2.ProcedureExecutor.execLoop(ProcedureExecutor.java:
841
)
at org.apache.hadoop.hbase.procedure2.ProcedureExecutor.execLoop(ProcedureExecutor.java:
794
)
at org.apache.hadoop.hbase.procedure2.ProcedureExecutor.access$
400
(ProcedureExecutor.java:
75
)
at org.apache.hadoop.hbase.procedure2.ProcedureExecutor$
2
.run(ProcedureExecutor.java:
479
)
参考https://issues.apache.org/jira/browse/HBASE-14729,进入hadoop文件系统,删除掉报错的目录或真个WALs
- TableExistsException: hbase:namespace
12345678910
zookeeper.MetaTableLocator: Failed verification of hbase:meta,,
1
at address=slave1,
16020
,
1428456823337
, exception=org.apache.hadoop.hbase.NotServingRegionException: Region hbase:meta,,
1
is not online on worker05,
16020
,
1428461295266
at org.apache.hadoop.hbase.regionserver.HRegionServer.getRegionByEncodedName(HRegionServer.Java:
2740
)
at org.apache.hadoop.hbase.regionserver.RSRpcServices.getRegion(RSRpcServices.java:
859
)
at org.apache.hadoop.hbase.regionserver.RSRpcServices.getRegionInfo(RSRpcServices.java:
1137
)
at org.apache.hadoop.hbase.protobuf.generated.AdminProtos$AdminService$
2
.callBlockingMethod(AdminProtos.java:
20862
)
at org.apache.hadoop.hbase.ipc.RpcServer.call(RpcServer.java:
2031
)
at org.apache.hadoop.hbase.ipc.CallRunner.run(CallRunner.java:
107
)
at org.apache.hadoop.hbase.ipc.RpcExecutor.consumerLoop(RpcExecutor.java:
130
)
at org.apache.hadoop.hbase.ipc.RpcExecutor$
1
.run(RpcExecutor.java:
107
)
at java.lang.Thread.run(Thread.java:
745
)
HMaster启动之后自动挂掉(或非正常重启),并且master的log里出现“TableExistsException: hbase:namespace”字样;
很可能是更换了Hbase的版本过后zookeeper还保留着上一次的Hbase设置,所以造成了冲突.
删除zookeeper信息,重启之后就没问题了1234# sh zkCli.sh -server slave1:
2181
[zk: slave1:
2181
(CONNECTED)
0
] ls /
[zk: slave1:
2181
(CONNECTED)
0
] rmr /hbase
[zk: slave1:
2181
(CONNECTED)
0
] quit
1,参考
- Hbase系统架构及数据结构 http://www.open-open.com/lib/view/open1346821084631.html
- HRegionServer详解 http://www.superwu.cn/2015/04/28/2081/
- HBase深入分析之RegionServer http://www.tuicool.com/articles/R3UB73
- Base 超详细介绍 http://blog.csdn.net/frankiewang008/article/details/41965543
- 搭建Zookeeper与Hbase过程及遇到的问题总结 http://my.oschina.net/hanzhankang/blog/129335?fromerr=zuMjZe9d
- hadoop hbase维护问题总结 http://www.tuicool.com/articles/yAr2Yf2
- HBase集群安装过程中的问题集锦 http://www.cnblogs.com/likehua/p/3850253.html
- hadoop集群,hbase集群常见错误 http://www.itomcn.com/hadoop-hbase-errors.html
- hbase常识及habse适合什么场景http://www.cnblogs.com/bhlsheji/p/5406816.html
HBase数据库集群配置【转】的更多相关文章
-
HBase数据库集群配置
0,HBase简介 HBase是Apache Hadoop中的一个子项目,是一个HBase是一个开源的.分布式的.多版本的.面向列的.非关系(NoSQL)的.可伸缩性分布式数据存储模型,Hbase依托 ...
-
mariadb 数据库集群配置
mariadb集群配置(主从和多主) mariadb主从 主从多用于网站架构,因为主从的同步机制是异步的,数据的同步有一定延迟,也就是说有可能会造成数据的丢失,但是性能比较好,因此网站大多数用的是 ...
-
MySQL数据库集群进行正确配置步骤
MySQL数据库集群进行正确配置步骤 2010-06-09 10:47 arrowcat 博客园 字号:T | T 我们今天是要和大家一起分享的是对MySQL数据库集群进行正确配置,我前两天在相关网站 ...
-
[推荐]Hadoop+HBase+Zookeeper集群的配置
[推荐]Hadoop+HBase+Zookeeper集群的配置 Hadoop+HBase+Zookeeper集群的配置 http://wenku.baidu.com/view/991258e881c ...
-
CentOS6安装各种大数据软件 第六章:HBase分布式集群的配置
相关文章链接 CentOS6安装各种大数据软件 第一章:各个软件版本介绍 CentOS6安装各种大数据软件 第二章:Linux各个软件启动命令 CentOS6安装各种大数据软件 第三章:Linux基础 ...
-
hbase集群配置
说明 安装 配置 启动 网页效果 一点废话 本文介绍hbase集群配置 说明 hbase想正确配置成功的前提是,你必须知道hadoop集群和zookeeper集群是如何配置的 安装 下载地址 http ...
-
Hbase集群类型|集群配置|服务器选型|磁盘容量规划
HBase和Hadoop的集群类型 1.单机模式 主要用于开发工作,一台机器上运行所有的守护进程,或者一台机器运行多个虚拟机.一般用于评估和测试. 2.小型集群 20台机器以内的集群,不同的机器运行不 ...
-
mycat数据库集群系列之mycat读写分离安装配置
最近在梳理数据库集群的相关操作,现在花点时间整理一下关于mysql数据库集群的操作总结,恰好你又在看这一块,供一份参考.本次系列终结大概包括以下内容:多数据库安装.mycat部署安装.数据库之读写分离 ...
-
Nginx集群配置与redis的session共享策略
一.什么是Nginx? Nginx (engine x) 是一个高性能的HTTP和反向代理服务器,也是一个IMAP/POP3/SMTP服务器.Nginx是由伊戈尔·赛索耶夫为俄罗斯访问量第二的Ramb ...
随机推荐
-
Mac OS下配置Eclipse C++的方法
http://nonlz.blog.163.com/blog/static/128872032201262622921622/
-
【转】Linux CentOS内核编译:下载CentOS源码、编译2.6.32-220的错误(apic.c:819 error &#39;numi_watchdog&#39; undeclared)
一.下载CentOS源码 1.1 查看CentOS版本 cat /etc/issue 1.2 查看Linux内核版本 uname -r 1.3 下载 文件名:kernel-2.6.32-220.el6 ...
-
admob 广告Android不显示
我弄个了ane,iOS上好好的,Android上打死不显示, 最后发现是少在xml里面增加一个配置,百度半天没搜索到. <android> <manifestAddi ...
-
JSTL获取list的大小,jstl获取list 的长度,EL表达式获取list的长度,EL表达式获取list大小
在jsp页面中不能通过${list.size}取列表长度,而是 <%@ taglib uri="http://java.sun.com/jsp/jstl/core" pref ...
-
RHEL6.4 KVM 桥接上网的设置
关闭网络管理器 chkconfig NetworkManager off ##和桥接有冲突,要关闭 service NetworkManager stop 修改eth0为物理网口,br0为桥接网 ...
-
C++ 全排列函数 nyoj 366
C++ STL中提供了std::next_permutation与std::prev_permutation可以获取数字或者是字符的全排列,其中std::next_permutation提供升序.st ...
-
EF加载实体的方式
原文:Loading Related Entities EF加载数据的方式: 预加载 eager loading 延迟加载 lazy loading 显示加载 explicit loading 预先加 ...
-
ngx-push-stream模块源码学习(四)——订阅
一.概述 push stream模块允许三种模式的订阅者: longpolling:每收到服务端响应数据即断开连接然后迅速重连,连接耗时可以忽略 stream:与服务端保持长连接,持续不断的请求-&g ...
-
[学习笔记]修改关键跳无效且关键CALL又不存在的情况
先用DI查下壳,VC++写的,无壳. 然后,打开软件看一下软件注册的情况 有弹窗,那载入OD看看能不能搜索到字符串 回到反汇编窗口,发现有两个JE都跳过了注册成功的代码 似乎很简单的样子,只要NOP掉 ...
-
[20171110]_allow_read_only_corruption参数.txt
[20171110]_allow_read_only_corruption参数.txt --//昨天在修改查询隐含参数脚本时发现一个参数_allow_read_only_corruption,感觉应该 ...