承接上文
承接上一章节的内容,下面我们看继续看拉取的调度模式,PULL与PUSH模式相比,PULL模式需要应用层不间断地进行拉取消息然后再执行消费处理,提高了应用层的编码复杂度,为了Pull方式的编程复杂度,RocketMQ提供了调度消费服务(MQPullConsumerScheduleService),在topic的订阅发送变化(初次订阅或距上次拉取消息超时)就触发PULL方式拉取消息。
MQPullConsumerScheduleService
MQPullConsumerScheduleService是PULL模式下面的调度服务,当RebalanceImpl.processQueueTable队列有变化时才进行消息的拉取,从而降低Pull方式的编程复杂度。在应用层按照如下方式使用:
使用MQPullConsumerScheduleService开发消费消息
实例化对象MQPullConsumerScheduleService
设置NameServer
设置消费组为集群模式
注册拉取回调函数
从上下文中获取MQPullConsumer对象,此处其实就是DefaultMQPullConsumer。
获取该消费组的该队列的消费进度
拉取消息,pull()方法在DefaultMQPullConsumer有具体介绍
更新消费组该队列消费进度
设置下次拉取消息时间间隔,单位毫秒
启动调度组件,调用MQPullConsumerScheduleService.start()方法启动该调度服务。
- 首先初始化队列监听器MessageQueueListenerImpl类,该类是MQPullConsumerScheduleService的内部类,实现了MessageQueueListener接口的messageQueueChanged方法;
- 将该监听器类赋值给DefaultMQPullConsumer.messageQueueListener变量值;
- 调用DefaultMQPullConsumer的start方法启动Consumer;
分析核心执行方法及流程
- 使用registerPullTaskCallback对Topic进行注册
- MQPullConsumerScheduleService 会将Topic的每个队列以及相应的 doPullTask() 实现放入名为 taskTable 的Hash表中。
- 线程池 scheduledThreadPoolExecutor 会不断的调用每个队列的 doPullTask() 函数。
- 在 doPullTask() 完成自己的拉取消息逻辑,和DefaultMQPullConsumer是一样的。
- 用户设置下次调用间隔时间
- scheduledThreadPoolExecutor 等待该间隔时间后,再次调用 doPullTask() 方法。
注册拉取任务回调函数
PullTaskCallback回调函数接口
调用MQPullConsumerScheduleService.registerPullTaskCallback (String topic, PullTaskCallback callback)方法,在该方法中以topic为key值将自定义的PullTaskCallback 对象存入MQPullConsumerScheduleService. callbackTable:ConcurrentHashMap<String ,PullTaskCallback>变量中;
建立PullTaskCallback接口的实现类,实现该接口的doPullTask(final MessageQueue mq, final PullTaskContext context)方法。
在该方法中可以先调用DefaultMQPullConsumer.fetchConsumeOffset (MessageQueue mq, boolean fromStore)方法获取MessageQueue队列的消费进度。
PullTaskContext拉取任务上下文
调用DefaultMQPullConsumer.pull(MessageQueue mq, String subExpression, long offset, int maxNums)方法,
- 指定的队列和指定的开始位置读取消息内容;
- 获取到的消息进行相关的业务逻辑处理;
- 调用DefaultMQPullConsumer.updateConsumeOffset(MessageQueue mq, long offset)方法进行消费进度的更新,其中offset值是在获取消息内容时返回的下一个消费进度值;
MQPullConsumerScheduleService的实现原理
触发拉取消息
RebalanceImpl.rebalanceByTopic()方法执行的过程中,若RebalanceImpl.processQueueTable有变化,则回调DefaultMQPullConsumer. messageQueueListener变量值的MessageQueueListenerImpl. MessageQueueChanged方法,在该方法中调用MQPullConsumerScheduleService. putTask(String topic, Set mqNewSet)方法。
- 若为广播模式(BROADCASTING),则mqNewSet为该topic下面的所有MessageQueue队列;
- 若为集群模式,则mqNewSet为给该topic分配的MessageQueue队列,putTask方法的大致逻辑如下:
- 遍历
MQPullConsumerScheduleService.taskTable: ConcurrentHashMap<MessageQueue, PullTaskImpl>
列表(表示正在拉取消息的任务列表),检查该topic下面的所有MessageQueue对象,若该对象不在入参mqNewSet集合中的,将对应的PullTaskImpl对象的cancelled变量标记为true。 - mqNewSet集合中的MessageQueue对象,若不在MQPullConsumerScheduleService.taskTable列表中,则以MessageQueue对象为参数初始化PullTaskImpl对象,然后放入taskTable列表中,将该PullTaskImpl对象放入
MQPullConsumerScheduleService.scheduledThreadPoolExecutor
线程池中,然后立即执行该线程。
拉取消息的线程(PullTaskImpl)
该PullTaskImpl线程的run方法如下:
- 检查cancelled变量是为true,若为false则直接退出该线程;否则继续下面的处理;
- 以MessageQueue对象的topic值从MQPullConsumerScheduleService.callbackTable变量中获取PullTaskCallback的实现类(该类是由应用层实现);
3, 调用该PullTaskCallback实现类的doPullTask方法,即实现业务层定义的业务逻辑(通用逻辑是先获取消息内容,然后进行相应的业务处理,最后更新消费进度);
4, 再次检查cancelled变量是为true,若不为true,则将该PullTaskImpl对象再次放入MQPullConsumerScheduleService. scheduledThreadPoolExecutor线程池中,设定在200毫秒之后重新调度执行PullTaskImpl线程类;