HBase协处理器入门

转载自过往记忆（https://www.iteblog.com/）

HBase 和 MapReduce 有很高的集成，我们可以使用 MR 对存储在 HBase 中的数据进行分布式计算。但是在很多情况下，例如简单的加法计算或者聚合操作（求和、计数等），如果能够将这些计算推送到 RegionServer，这将大大减少服务器和客户的的数据通信开销，从而提高 HBase 的计算性能，这就是本文要介绍的协处理器（Coprocessors）。

HBase 的协处理器是从 0.92.0 开始引入的，参见 HBASE-2000。它的实现灵感来源于 Jeff Dean 在 LADIS 2009 分享主题《Designs, Lessons and Advice fromBuilding LargeDistributed Systems》中关于 Google 的 BigTable 协处理器的分享。当时的 BigTable 协处理器具有以下功能：

每个表服务器的任意子表都可以运行代码；
客户端的高层调用接口；
跨多行的调用会自动拆分为多个并行化的 RPC 请求；
通过协处理器可以非常灵活的构建分布式服务模型，能够自动化扩展、负载均衡、应用请求路由等。

HBase 当然也想要一个这么好的功能，因为通过这个功能我们可以实现二级索引（secondary indexing）、复杂过滤（complex filtering）比如谓词下推（push down predicates）以及访问控制等功能。虽然 HBase 协处理器受 BigTable 协处理器的启发，但在实现细节方面存在差异。HBase 为我们建立了一个框架，并提供类库和运行时环境，使得我们可以在 HBase RegionServer 和 Master 上运行用户自定义代码；而 Google 的 BigTable 却不是这样的。

协处理器支持的扩展

协处理器框架已经为我们提供了一些实现类，我们可以通过继承这些类来扩展自己的功能。这些类主要分为两大类，即 Observer 和 Endpoint。

Observer

Observer 和 RDMBS 的触发器很类似，在一些特定的事件发生时被执行。这些事件包括用户产生的事件，也包括服务器内部产生的事件。目前 HBase 内置实现的 Observer 主要有以下几个：

WALObserver：提供控制 WAL 的钩子函数；
MasterObserver：可以被用作管理或 DDL 类型的操作，这些是集群级的事件；
RegionObserver：用户可以用这种处理器处理数据修改事件，它们与表的 Region 联系紧密；
BulkLoadObserver：进行 BulkLoad 的操作之前或之后会触发这个钩子函数；
RegionServerObserver ：RegionServer 上发生的一些操作可以触发一些这个钩子函数，这个是 RegionServer 级别的事件；
EndpointObserver：每当用户调用 Endpoint 之前或之后会触发这个钩子，主要提供了一些回调方法。

Endpoint

Endpoint 和 RDMBS 的存储过程很类似，用户提供一些自定义代码，并在 HBase 服务器端执行，结果通过 RPC 返回给客户。比较常见的场景包括聚合操作（求和、计数等）。有了 Endpoint ，我们就可以充分利用服务器的资源，进行一些计算，大大提升计算的效率和通讯的开销。

协处理器编写和配置

下面我将通过介绍一个计数的例子来介绍 HBase 协处理器的使用。我们知道，HBase 自带了一个 count 命令用于计算某张表的行数，但是这个命令是单线程执行，效率非常低。我们可以通过 Endpoint 来实现一个计数类，并利用集群的资源来计算，最终将结果返回到客户端，客户端这边通过对结果进行汇总得到最终的结果。其实，HBase 自带了一个名为 RowCountEndpoint 的例子，里面就实现了计数逻辑。注意本文基于 HBase 1.4.0 进行介绍的，HBase 2.x 的代码已经有些变化，但大部分结构都类似。

  1 package org.apache.hadoop.hbase.coprocessor.example;
  2  
  3 import java.io.IOException;
  4 import java.util.ArrayList;
  5 import java.util.List;
  6  
  7 import org.apache.hadoop.hbase.Cell;
  8 import org.apache.hadoop.hbase.CellUtil;
  9 import org.apache.hadoop.hbase.Coprocessor;
 10 import org.apache.hadoop.hbase.CoprocessorEnvironment;
 11 import org.apache.hadoop.hbase.client.Scan;
 12 import org.apache.hadoop.hbase.coprocessor.CoprocessorException;
 13 import org.apache.hadoop.hbase.coprocessor.CoprocessorService;
 14 import org.apache.hadoop.hbase.coprocessor.RegionCoprocessorEnvironment;
 15 import org.apache.hadoop.hbase.coprocessor.example.generated.ExampleProtos;
 16 import org.apache.hadoop.hbase.filter.FirstKeyOnlyFilter;
 17 import org.apache.hadoop.hbase.protobuf.ResponseConverter;
 18 import org.apache.hadoop.hbase.regionserver.InternalScanner;
 19 import org.apache.hadoop.hbase.util.Bytes;
 20  
 21 import com.google.protobuf.RpcCallback;
 22 import com.google.protobuf.RpcController;
 23 import com.google.protobuf.Service;
 24  
 25 public class RowCountEndpoint extends ExampleProtos.RowCountService
 26     implements Coprocessor, CoprocessorService {
 27   private RegionCoprocessorEnvironment env;
 28  
 29   public RowCountEndpoint() {
 30   }
 31  
 32   /**
 33    * Just returns a reference to this object, which implements the RowCounterService interface.
 34    */
 35   @Override
 36   public Service getService() {
 37     return this;
 38   }
 39  
 40   /**
 41    * 返回表的行数
 42    */
 43   @Override
 44   public void getRowCount(RpcController controller, ExampleProtos.CountRequest request,
 45                           RpcCallback<ExampleProtos.CountResponse> done) {
 46     Scan scan = new Scan();
 47     scan.setFilter(new FirstKeyOnlyFilter());
 48     ExampleProtos.CountResponse response = null;
 49     InternalScanner scanner = null;
 50     try {
 51       scanner = env.getRegion().getScanner(scan);
 52       List<Cell> results = new ArrayList<Cell>();
 53       boolean hasMore = false;
 54       byte[] lastRow = null;
 55       long count = 0;
 56       do {
 57         hasMore = scanner.next(results);
 58         for (Cell kv : results) {
 59           byte[] currentRow = CellUtil.cloneRow(kv);
 60           if (lastRow == null || !Bytes.equals(lastRow, currentRow)) {
 61             lastRow = currentRow;
 62             count++;
 63           }
 64         }
 65         results.clear();
 66       } while (hasMore);
 67  
 68       response = ExampleProtos.CountResponse.newBuilder()
 69           .setCount(count).build();
 70     } catch (IOException ioe) {
 71       ResponseConverter.setControllerException(controller, ioe);
 72     } finally {
 73       if (scanner != null) {
 74         try {
 75           scanner.close();
 76         } catch (IOException ignored) {}
 77       }
 78     }
 79     done.run(response);
 80   }
 81  
 82   /**
 83    * 返回表中 KV 的数量
 84    */
 85   @Override
 86   public void getKeyValueCount(RpcController controller, ExampleProtos.CountRequest request,
 87                                RpcCallback<ExampleProtos.CountResponse> done) {
 88     ExampleProtos.CountResponse response = null;
 89     InternalScanner scanner = null;
 90     try {
 91       scanner = env.getRegion().getScanner(new Scan());
 92       List<Cell> results = new ArrayList<Cell>();
 93       boolean hasMore = false;
 94       long count = 0;
 95       do {
 96         hasMore = scanner.next(results);
 97         for (Cell kv : results) {
 98           count++;
 99         }
100         results.clear();
101       } while (hasMore);
102  
103       response = ExampleProtos.CountResponse.newBuilder()
104           .setCount(count).build();
105     } catch (IOException ioe) {
106       ResponseConverter.setControllerException(controller, ioe);
107     } finally {
108       if (scanner != null) {
109         try {
110           scanner.close();
111         } catch (IOException ignored) {}
112       }
113     }
114     done.run(response);
115   }
116  
117   @Override
118   public void start(CoprocessorEnvironment env) throws IOException {
119     if (env instanceof RegionCoprocessorEnvironment) {
120       this.env = (RegionCoprocessorEnvironment)env;
121     } else {
122       throw new CoprocessorException("Must be loaded on a table region!");
123     }
124   }
125  
126   @Override
127   public void stop(CoprocessorEnvironment env) throws IOException {
128     // nothing to do
129   }
130 }

View Code

由于 HBase 内部使用 protobuf 协议进行通信，所以这个例子定义了名为 Examples.proto 的文件：

 1 package hbase.pb;
 2  
 3 option java_package = "org.apache.hadoop.hbase.coprocessor.example.generated";
 4 option java_outer_classname = "ExampleProtos";
 5 option java_generic_services = true;
 6 option java_generate_equals_and_hash = true;
 7 option optimize_for = SPEED;
 8  
 9 message CountRequest {
10 }
11  
12 message CountResponse {
13   required int64 count = 1 [default = 0];
14 }
15  
16 service RowCountService {
17   rpc getRowCount(CountRequest)
18     returns (CountResponse);
19   rpc getKeyValueCount(CountRequest)
20     returns (CountResponse);
21 }

View Code

由于 RowCountEndpoint 类是 HBase 自带的例子，所以在我们的 HBase 类路径下已经加载了这个类，在实际的应用中，我们需要将 Examples.proto 文件生成对应的类，并将相关的类进行编译打包（具体如何编译可以参见《在 IDEA 中使用 Maven 编译 proto 文件》）。因为这个类 HBase 其实已经编译好了，所以我就不再进行介绍了，直接讲如何部署。

协处理器部署

协处理器的部署有很多种方法，这里我将一一进行介绍。

通过 hbase-site.xml 文件进行配置

我们可以直接在 hbase-site.xml 文件里面进行配置，配置完之后需要重启 HBase 集群，而且这个配置是全局影响的。如下设置：

<property>
    <name>hbase.coprocessor.region.classes</name>
    <value>org.apache.hadoop.hbase.coprocessor.RowCountEndpoint</value>
</property>

　　因为 RowCountEndpoint 这个类是 HBase 自带的，如果是我们自定义的 Endpoint，我们需要将打包好的 jar 包放到所有节点的 $HBASE_HOME/lib/ 路径下。

通过 HBase Shell 配置

如果我们只想对某一张表设置 Endpoint，那么可以直接在 HBase Shell 中进行配置，如下：

hbase(main):018:0> alter \'iteblog\',\'coprocessor\'=>\'|org.apache.hadoop.hbase.coprocessor.example.RowCountEndpoint ||\'
Updating all regions with the new schema...
9/27 regions updated.
27/27 regions updated.
Done.
0 row(s) in 3.0580 seconds

　说明：上面的 coprocessor 设置的值为 \'|org.apache.hadoop.hbase.coprocessor.example.RowCountEndpoint ||\'，它的值主要由四部分组成。\'coprocessor\' => \'Jar File Path|Class Name|Priority|Arguments\'。其中

Jar File Path：协处理器实现类所在 Jar 包的路径，这个路径要求所有的 RegionServer 能够读取得到。比如放在所有 RegionServer 的本地磁盘；比较推荐的做法是将文件放到 HDFS 上。如果没有设置这个值，那么将直接从 HBase 服务的 classpath 中读取。
Class Name：协处理器实现类的类名称，包括包名。
Priority：协处理器的优先级，是一个整数。如果同一个钩子函数有多个协处理器实现，那么将按照优先级执行。如果没有指定，将按照默认优先级执行。
Arguments：传递给协处理器实现类的参数列表，可以不指定。

这四个部分使用 | 符号进行分割。

通过 HBase API 配置

除了可以通过 HBase Shell 和 hbase-site.xml 配置文件来加载协处理器，还可以通过 Client API 来加载协处理器。具体的方法是调用 HTableDescriptor 的 addCoprocessor 方法。该方法有两种调用形式：

addCoprocessor(String className)：传入类名。该方法类似通过配置来加载协处理器，用户需要先把jar包分发到各个 RegionServer 的 $HBASE_HOME/lib 目录下。
addCoprocessor(String className, Path jarFilePath, int priority, final Map kvs)：该方法类似通过 Shell 来加载协处理器。通过调用该方法可以同时传入协处理器的 className 以及 jar 所在的路径，priority 是协处理器的执行优先级，kvs 是给协处理器预定义的参数。

使用如下：

Admin admin = connection.getAdmin();
HTableDescriptor htd = new HTableDescriptor(TableName.valueOf("iteblog"));
htd.addCoprocessor("org.apache.hadoop.hbase.coprocessor.example.RowCountEndpoint");
htd.addFamily(new HColumnDescriptor("f"));
admin.createTable(htd);

当然，其实我们还可以调用 HTableDescriptor 的 setValue 方法来设置协处理器实现类：

Admin admin = connection.getAdmin();
HTableDescriptor htd = new HTableDescriptor(TableName.valueOf("iteblog"));
htd.setValue("COPROCESSOR$1", "|org.apache.hadoop.hbase.coprocessor.example.RowCountEndpoint||");
htd.addFamily(new HColumnDescriptor("f"));
admin.createTable(htd);

如何判断协处理器设置生效

可以通过 HBase Shell 提供的 describe 命令查看的

hbase(main):040:0> describe \'iteblog\'
Table iteblog is ENABLED
iteblog, {TABLE_ATTRIBUTES => {coprocessor$1 => \'|org.apache.hadoop.hbase.coprocessor.example.RowCountEndpoint ||\'}
COLUMN FAMILIES DESCRIPTION
{NAME => \'f\', BLOOMFILTER => \'ROW\', VERSIONS => \'1\', IN_MEMORY => \'false\', KEEP_DELETED_CELLS => \'FALSE\', DATA_BLOCK_ENCODING => \'NONE\', TTL => \'FOREVER\', COMPRESSION => \'NONE\', MIN_VERSIONS => \'0\', BLOCKCACHE => \'true\', BLOCKSIZE => \'65536\', REPLICATION_SCOPE => \'0\'}
1 row(s) in 0.0650 seconds

当然，我们也可以通过 HBase 提供的 UI 页面查看的，这里就不介绍了。

卸载协处理器

如果你需要卸载之前部署好的协处理器，可以使用下面命令实现：

hbase(main):006:0> alter \'iteblog\',METHOD => \'table_att_unset\', NAME=> \'coprocessor$1\'
Updating all regions with the new schema...
27/27 regions updated.
Done.
Took 3.5417 seconds

使用协处理器

通过上面几步，我们已经为表设置好了协处理器，现在我们可以编写客户端程序来调用这个协处理器，主要通过 HTable 的 coprocessorService 方法实现，这个方法主要由三种实现：

coprocessorService(byte[] row)：这个通过 row 来定位对应的 Region，然后在这个 Region 上运行相关的协处理器代码。
coprocessorService(final Class<T> service, byte[] startKey, byte[] endKey, final Batch.Call<T,R> callable)：service 指定是调用哪个协处理器实现类，因为一个 Region 上可以部署多个协处理器，客户端必须通过指定 Service 类来区分究竟需要调用哪个协处理器提供的服务。startKey 和 endKey 主要用于确定需要与那些 Region 进行交互。callable 定义了如何调用协处理器，用户通过重载该接口的 call() 方法来实现客户端的逻辑。在 call() 方法内，可以调用 RPC，并对返回值进行任意处理。
coprocessorService(final Class<T> service, byte[] startKey, byte[] endKey, final Batch.Call<T,R> callable, final Batch.Callback<R> callback)：这个方法和第二个比较多了一个 callback，coprocessorService 会为每一个 RPC 返回结果调用该 callback，用户可以在 callback 中执行需要的逻辑，比如执行 sum 累加。第二个方法，每个 Region 协处理器 RPC 的返回结果先放入一个列表，所有的 Region 都返回后，用户代码再从该列表中取出每一个结果进行累加；用这种方法，直接在 callback 中进行累加，省掉了创建结果集合和遍历该集合的开销，效率会更高一些。

这里我们调用第二种方法，具体的代码如下：

 1 package com.iteblog.data;
 2  
 3 import java.io.IOException;
 4 import java.util.Map;
 5  
 6 import org.apache.hadoop.hbase.client.HTable;
 7 import org.apache.hadoop.hbase.client.coprocessor.Batch;
 8 import org.apache.hadoop.hbase.coprocessor.example.generated.ExampleProtos;
 9 import org.apache.hadoop.hbase.ipc.BlockingRpcCallback;
10 import org.apache.hadoop.hbase.ipc.CoprocessorRpcChannel;
11 import org.apache.hadoop.hbase.ipc.ServerRpcController;
12  
13 public class RowCounter {
14  
15     public static void main(String[] args) throws Throwable {
16         HTable table = HBaseDataGenerator.getOrCreateHTable("iteblog");
17         final ExampleProtos.CountRequest request = ExampleProtos.CountRequest.getDefaultInstance();
18  
19         Map<byte[], Long> results = table.coprocessorService(ExampleProtos.RowCountService.class,
20                 null, null,
21                 new Batch.Call<ExampleProtos.RowCountService, Long>() {
22                     public Long call(ExampleProtos.RowCountService counter) throws IOException {
23                         ServerRpcController controller = new ServerRpcController();
24                         BlockingRpcCallback<ExampleProtos.CountResponse> rpcCallback =
25                                 new BlockingRpcCallback<ExampleProtos.CountResponse>();
26  
27                         //实现在server端
28                         counter.getRowCount(controller, request, rpcCallback);
29                         ExampleProtos.CountResponse response = rpcCallback.get();
30                         if (controller.failedOnException()) {
31                             throw controller.getFailedOn();
32                         }
33                         return (response != null && response.hasCount()) ? response.getCount() : 0;
34                     }
35                 });
36  
37         int sum = 0;
38         int count = 0;
39  
40         for (Long l : results.values()) {
41             sum += l;
42             count++;
43         }
44         System.out.println("Total Row Counts = " + sum);
45         System.out.println("Region Counts = " + count);
46     }
47 }

View Code

运行这段代码，就可以快速算出 iteblog 表的总行数。如果我们把 counter.getRowCount(controller, request, rpcCallback); 修改成 counter.getKeyValueCount(controller, request, rpcCallback);，那么将会返回 iteblog 表 KV 的总数。上面查询运行的流程可以用下面的图来表示

图中 Client A 的过程就是上面程序的处理流程，主要是并行 RPC 请求。从图中可以看到，这个表的所有 Region 都会参与计算，每个 Region 计算出自己的总数，然后返回给客户端，所有的 Region 结果最后存储在 Map results中，其中 Key 是每个 Region 的名字，Value 就是这个 Region 计算到的行数。我们只需要遍历这个 Map，然后将所有 Region 计算的行数加起来就是整个表的行数。

如果我们仅仅想计算某个 row 对应的 Region 的行数，可以实现如下：

CoprocessorRpcChannel coprocessorRpcChannel = table.coprocessorService("row-890".getBytes());
 
ExampleProtos.RowCountService.BlockingInterface service =
           ExampleProtos.RowCountService.newBlockingStub(coprocessorRpcChannel);
final ExampleProtos.CountRequest request = ExampleProtos.CountRequest.getDefaultInstance();
ExampleProtos.CountResponse rowCount = service.getRowCount(null, request);
System.out.println(rowCount.getCount());

　上面代码可以返回 row-890 所在 Region 的行数，由于这个 Row 只对应于一个 Region，所以上面代码的运行流程见上图的 Client B 运行过程。可以看出，这个程序仅仅发出一个 RPC 请求。

秒客网

HBase协处理器入门

协处理器支持的扩展

Observer

Endpoint

协处理器编写和配置

协处理器部署

通过 hbase-site.xml 文件进行配置

通过 HBase Shell 配置

通过 HBase API 配置

如何判断协处理器设置生效

卸载协处理器

使用协处理器

相关文章