HBase Shell 接口本身没有什么可谈的,网上许多内容都有介绍, 半个小时就可以入门。同事们要我推荐一下,那就推荐三个如下:
(1) http://wiki.apache.org/hadoop/Hbase/Shell
(2) ./hbase shell 打开shell, run 'help' to get help information
(3)http://qibaopeng2000.blog.163.com/blog/static/691776952010112444553279/ (这个网上很多相同或者类似的内容)
总结培训当天反馈的问题,新手们需要注意几点:
问题1, HBase(可以理解为不需要建'name'列,hbase自动建立一个用于存储“行标识”的“列”),举例如下:
例一:
create 'employees', 'SN', 'department', 'address' 这个employees表的结构将为:
row_id SN department address
--------------------------------------------------
共有四列,第一列用于标识行, 这里你可以当做‘name’来用
插入数据: put 'employees', 'HongKong', 'SN:', '20080501'
注意是put,不是Ruby的puts
对比的情况:
创建表: create 'employees', 'name', 'SN', 'department', 'address'
此时数据为: 除了标识本身外,还有一个name列,下面简单设置为一样的值。
put 'employees', 'HongKong', 'name:', 'HongKong'
例二:
网上流行资料的例子:
一个存储学生成绩的表:
name grad course:math course:art
Tom 1 87 97
Jerry 2 100 80
这里grad对于表来说是一个列,course对于表来说是一个列族,这个列族由两个列组成:math和art,当然我们可以根据我们的需要在course中建立更多的列族,如computer,physics等相应的列添加入course列族. 建立一个表格 scores 具有两个列族grad 和courese
hbase(main):002:0> create 'scores', 'grade', 'course'
0 row(s) in 4.1610 seconds
分析,请注意,为什么创建的表是没有“name”这一列呢? 其实这里的name列就对应例一的row_id,不用显式创建的。
导入数据为: put 'scores', 'Tom', 'grade:', '1' , Tom对应name
问题2. 参数的警告说明
很多人开始都碰到类似
hbase(main):034:0> put 'employees', 'HongKong', 'name:', 'Hongkong', 'SN:', '20080501'
ArgumentError: wrong number of arguments (6 for 5)
hbase(main):033:0> put 'employees', 'Kong', 'name:' 'Kong'
ArgumentError: wrong number of arguments (3 for 4)
这是参数数量不对的说明, 请尤其注意逗号, 空格不能用来分隔参数的。
以put为例,参数一般为5个, 6个 10个都报错。但为什么又有(3 for 4)呢? 5和4个的时候可以工作呢? timestamp 是optional的。所以参数多的时候, 按照上限5报警,少的时候按照下限4报警。
put Put a cell 'value' at specified table/row/column and optionally
timestamp coordinates. To put a cell value into table 't1' at
row 'r1' under column 'c1' marked with the time 'ts1', do:
hbase> put 't1', 'r1', 'c1', 'value', ts1
问题3. 插入数据
hbase(main):030:0> put 'employees', 'Tom', 'name:' 'Tom', 'SN:', '20091101', 'department:', 'D&R', 'address:country', 'China', 'address:city', 'Beijing'
ArgumentError: wrong number of arguments (11 for 5)
怎么回事呢? 不要老想着SQL, put插入的Cell数据, 这么多一起来,当然报错咯
问题4. 删除表必须先停,然后再删: To remove the table, you must first disable it before dropping it
hbase(main):025:0> disable 'test'
09/04/19 06:40:13 INFO client.HBaseAdmin: Disabled test
0 row(s) in 6.0426 seconds
hbase(main):026:0> drop 'test'
09/04/19 06:40:17 INFO client.HBaseAdmin: Deleted test
问题5. 如何运行脚本文件
${HBASE_HOME}/bin/hbase shell PATH_TO_SCRIPT示例:
./hbase shell /data/automation/create_import.hbase
--------------------------------------------------------------------------------------------
disable 'employees'
drop 'employees'
create 'employees', 'SN', 'department', 'address'
put 'employees', 'HongKong', 'SN:', '20080501189'
put 'employees', 'HongKong', 'department:', 'R&D'
put 'employees', 'HongKong', 'address:country', 'China'
put 'employees', 'HongKong', 'address:city', 'Beijing'
put 'employees', 'Cudynia', 'SN:', '20010807368'
put 'employees', 'Cudynia', 'department:', 'HR'
put 'employees', 'Cudynia', 'address:country', 'US'
put 'employees', 'Cudynia', 'address:city', 'San Francisco'
exit