使用HBase Shell 接口的注意事项

时间:2022-12-18 18:15:57

HBase Shell 接口本身没有什么可谈的,网上许多内容都有介绍, 半个小时就可以入门。同事们要我推荐一下,那就推荐三个如下:

(1) http://wiki.apache.org/hadoop/Hbase/Shell

(2)  ./hbase shell 打开shell, run 'help' to get help information

(3)http://qibaopeng2000.blog.163.com/blog/static/691776952010112444553279/ (这个网上很多相同或者类似的内容)


总结培训当天反馈的问题,新手们需要注意几点:

问题1,  HBase(可以理解为不需要建'name'列,hbase自动建立一个用于存储“行标识”的“列”),举例如下:

例一:

create 'employees', 'SN', 'department', 'address'   这个employees表的结构将为:

row_id     SN    department    address

--------------------------------------------------

共有四列,第一列用于标识行, 这里你可以当做‘name’来用

插入数据: put 'employees', 'HongKong', 'SN:', '20080501'

注意是put,不是Ruby的puts

对比的情况:

创建表: create 'employees', 'name', 'SN', 'department', 'address'

此时数据为: 除了标识本身外,还有一个name列,下面简单设置为一样的值。

put 'employees', 'HongKong', 'name:', 'HongKong'

例二:

网上流行资料的例子:


一个存储学生成绩的表:


name grad      course:math   course:art
Tom    1                87                    97
Jerry   2            100                  80

这里grad对于表来说是一个列,course对于表来说是一个列族,这个列族由两个列组成:math和art,当然我们可以根据我们的需要在course中建立更多的列族,如computer,physics等相应的列添加入course列族.  建立一个表格 scores 具有两个列族grad 和courese
hbase(main):002:0> create 'scores', 'grade', 'course'
0 row(s) in 4.1610 seconds

分析,请注意,为什么创建的表是没有“name”这一列呢? 其实这里的name列就对应例一的row_id,不用显式创建的。

导入数据为:  put 'scores', 'Tom', 'grade:', '1'     , Tom对应name


问题2. 参数的警告说明

很多人开始都碰到类似

hbase(main):034:0> put 'employees', 'HongKong', 'name:', 'Hongkong', 'SN:', '20080501'
ArgumentError: wrong number of arguments (6 for 5)


hbase(main):033:0> put 'employees', 'Kong', 'name:' 'Kong'
ArgumentError: wrong number of arguments (3 for 4)

这是参数数量不对的说明, 请尤其注意逗号, 空格不能用来分隔参数的。


以put为例,参数一般为5个, 6个 10个都报错。但为什么又有(3 for 4)呢?  5和4个的时候可以工作呢?  timestamp 是optional的。所以参数多的时候, 按照上限5报警,少的时候按照下限4报警。

 put       Put a cell 'value' at specified table/row/column and optionally
           timestamp coordinates.  To put a cell value into table 't1' at
           row 'r1' under column 'c1' marked with the time 'ts1', do:

           hbase> put 't1', 'r1', 'c1', 'value', ts1


问题3.  插入数据

hbase(main):030:0> put 'employees', 'Tom', 'name:' 'Tom', 'SN:', '20091101', 'department:', 'D&R', 'address:country', 'China', 'address:city', 'Beijing'
ArgumentError: wrong number of arguments (11 for 5)

怎么回事呢?  不要老想着SQL, put插入的Cell数据,  这么多一起来,当然报错咯


问题4.  删除表必须先停,然后再删: To remove the table, you must first disable it before dropping it

hbase(main):025:0> disable 'test'
09/04/19 06:40:13 INFO client.HBaseAdmin: Disabled test
0 row(s) in 6.0426 seconds
hbase(main):026:0> drop 'test'
09/04/19 06:40:17 INFO client.HBaseAdmin: Deleted test


问题5.  如何运行脚本文件

${HBASE_HOME}/bin/hbase shell PATH_TO_SCRIPT
示例:

./hbase shell /data/automation/create_import.hbase

--------------------------------------------------------------------------------------------

disable 'employees'
drop 'employees'

create 'employees', 'SN', 'department', 'address'
put 'employees', 'HongKong', 'SN:', '20080501189'
put 'employees', 'HongKong', 'department:', 'R&D'
put 'employees', 'HongKong', 'address:country', 'China'
put 'employees', 'HongKong', 'address:city', 'Beijing'
put 'employees', 'Cudynia', 'SN:', '20010807368'
put 'employees', 'Cudynia', 'department:', 'HR'
put 'employees', 'Cudynia', 'address:country', 'US'
put 'employees', 'Cudynia', 'address:city', 'San Francisco'

exit