netty源码解解析(4.0)-20 ChannelHandler: 自己实现一个自定义协议的服务器和客户端

时间:2022-11-23 08:20:38

  本章不会直接分析Netty源码,而是通过使用Netty的能力实现一个自定义协议的服务器和客户端。通过这样的实践,可以更深刻地理解Netty的相关代码,同时可以了解,在设计实现自定义协议的过程中需要解决的一些关键问题。

  本周章涉及到的代码可以从github上下载: https://github.com/brandonlyg/tinytransport.git

设计协议

  本章要设计的协议是基于TCP的应用层协议。在设计一个协议之前需要先回答以下几个问题:

  • 使用场景是什么?
  • 这个协议有哪些功能?
  • 性能上有什么要求?
  • 对网络带宽有什么要求?
  • 安全上有哪些要求?  

  接下来依次回答这些问题:

  

  使用场景

  在可信任的内部网络中,不同进程之间高速交换消息。

  功能

  • 在客户端和服务器进行消息交换。
  • 发送消息然后异步接收响应。
  • 客户端和服务器之间可以保持长连接。
  • 传输大量的数据。

  性能

  数据包的提取性能接近内存copy。

  

  扩展性

  可以通过扩展header字段,进而扩展协议的功能。

  带宽

  尽量少的冗余数据,占用尽量小的带宽。

  

  安全

  由于是在可信任的内网中交互消息,没有特别端安全性要求。

  这些问题的答案,就是整个协议的设计要求。下面就按照这些设计要求来设计一套完整的协议,具体类容包括以下两个部分:

  • 数据包的格式。
  • 客户端和服务器端消息的交互规则。

数据包格式的设计

  设计自己的数据包格式之前,我们先来回顾以下LengthFieldBasedFrameDecoder能够处理的数据包格式:

  | header | contentLength | conent |

  这个类把header的设计留给了子类,现在我们的注意力只需要集中在header字段上即可。下面是header设计:

  | begin | version | cmd | contentType | compression | sequenceId | resCode |

  整个数据包的格式就是:

  | begin | version | cmd | contentType | compression | sequenceId | resCode | contentLength | content |

  现在来看一下这个数据包能实现哪些设计要求。

  begin

  类型: 32位无符号整数(uint32),这字段是一个常量,用来准确第定位到数据包的开始位置,这样就能更准确地分离出数据包,进而保证了“客户端和服务器端进行消息交换”。它的设计还要平衡数据包提取性能和准确性。严格来说,数据包中只能有一个begin,形式化描述如下:

  1. 设一个数据包P的长度是L,P(i)表示数据包中任意一个Byte,begin=0XADEF4BC9(这个值可以任意选择,尽量不选择有意义的数字)。

  2. 设反序列化一个uint32的算法是ui=deserUint32(i), i>=0 && i < L。

  3. 必须满足: deserUint32(0) == begin, 且deserUint32(i) != begin, i > 0 && i < L。

  要在(1)(2)两个前提条件下满足第(3)点,需要设计一个转义符EC=0xFF, 对P中除begin以外的部分进行转义,转义算法是:

  如果deserUint32(i)==begin或P(i)==EC,  在P(i)前面插入EC。

  找到begin的算法是:

  如果deserUint32(i)==begin且P(i-1)!=EC。

  逆转义算法是:

  如果P(i)==EC, P(i+1)==EC或deserUint32(i+1)==begin,  删除P(i)。

  以上使用转义符的方案,虽然能够准确地找到begin,但算法复杂度是O(L),显然不能满足“接近内存copy"这个要求。但是如果不使用转义符,就可以达到这个性能要求。如果仔细计算一下begin重复的概率就会发现, 它的重复概率只有1/0x100000000,如果再结合length字段一起检查数据包的正确性,得到错误数据包的概率就会更低。不使用转义符,以极小的出错概率换取性能大幅提升是一笔合适的买卖。

  总的来说,begin可以满足两个设计要求: 消息交换,数据包的提取性能接近内存copy。

  

  version

  类型:uint8。协议的版本号,这个字段用来满足“扩展性”要求。每个version对应一种不同的header结构,换言之,知道了版本号,就知道怎样解析header。 

  cmd

  类型: uint8。这个字段用来定义不同数据包的功能。可以使用这个字段定义心跳数据包,使用心跳数据包让"服务器和客户端保持长连接"。此外业务层可使用这个字段定义自己需要的数据包。

  contentType

  类型: uint8。这个字段是content的类型。使用这个字段可以在content数据交给业务层之前,对他进行一下特殊的处理。用户可以定义自己的的消息类型。它可以加"消息交换"的能力。

  

  compression

  类型: uint8。 压缩算法。这个字段可以用来表示content使用的压缩算法。通过使用适当的压缩算法,压缩满足"传输大量数据"和"带宽"的要求。

  

  sequenceId

  类型: uint32。这个字段是数据包的唯一序列号。只需要保证在一个socket连接建立-断开周期内保证它的唯一性即可。使用这个ID,可以实现“发送消息然后异步接收响应”。

  

  resCode

  类型: uint8。响应数据包的状态码,用来在响应数据包中附带异常信息。  

  至此数据包的格式已经设计完毕。接下来设计必要的交互规则。

协议交互规则设计

  使用心跳保持长连接

  cmd: PING(0x01), PONG(0x02)。客户端连接到服务器之后,每隔一段时间发送一个PING包,服务器端收到之后立即响应PONG包。服务器端在一个超时时间后没有收到PING就认为TCP连接不可用,主动端开。客户端在发送PING之后,经过一个超时时间后没有收到PONG就认为连接不可用,重新建立连接。

 

  消息的请求和响应

  cmd: REQUEST(0x10), RESPONSE(0x02)。客户端使用REQUEST包向服务器发送请求,服务使用RESPONSE包响应。请求和响应的sequenceId一致。

  

  推送消息

  cmd: PUSH(0x20)。使用PUSH向对方推送消息,不需要响应。

代码分析

  这个轻量级的客户端和服务器框架在架构上分为4个部分:

  • 数据包: Frame, FrameDecoder, FrameEncoder, FrameGzipCodec。
  • 消息: FMessage, FrameToMessageDecoder, MessageToFrameEncode, FMessageHandler, FMessageTrait, FMTraits。
  • 客户端框架: TcpConnector, TcpClient。
  • 服务器端框架: TcpServer。

  由于前面已经详细讲解了设计原理,这里只重点分析一下关键代码。

  Frame

  Frame是数据包类型,它的主要功能是数据包的序列化(encode方法)和反序列化(decode)。

  序列化方法:

 /**
* 把Frame对象编码成数据包
* @param out
*/
public void encode(ByteBuf out){
out.writeInt(BEGIN);
out.writeByte(header.getVersion());
out.writeByte(header.getCmd().getValue());
out.writeByte(header.getContentType());
out.writeByte(header.getCompression());
out.writeInt(header.getSequenceId());
out.writeByte(header.getResCode()); int contentLength = 0;
if(null != content){
contentLength = content.readableBytes();
}
if(contentLength > MAX_CONTENT_LENGTH){
throw new TooLongFrameException("content too long. contentLength:"+contentLength);
}
out.writeShort(contentLength);
if(null != content){
out.writeBytes(content);
}
}

  6-12行,序列化header中除contentLength的其他字段。

  14-21行,序列化contentLength字段。

  22-24行,序列content。

  反序列化方法

 /**
* 从数据包解码得到Frame
* @param in 一个完整的数据包
* @return Frame对象
*/
public static Frame decode(ByteBuf in){
if(in.readableBytes() < HEADER_LENGTH){
throw new CorruptedFrameException("pack length less than header length("+HEADER_LENGTH+")");
} //得到header
Header header = new Header();
in.readInt();
header.setVersion(in.readByte());
header.setCmd(Command.valueOf(in.readByte() & 0xFF));
header.setContentType((byte)(in.readByte() & 0xFF));
header.setCompression((byte)(in.readByte() & 0xFF));
header.setSequenceId(in.readInt());
header.setResCode((byte)(in.readByte() & 0xFF)); //读出content
int contentLength = in.readShort() & 0xFFFF;
if(in.readableBytes() != contentLength){
throw new CorruptedFrameException("content is not match."+in.readableBytes() + "-" + contentLength);
} ByteBuf content = contentLength > 0 ? in.retainedSlice(in.readerIndex(), contentLength) : null;
in.skipBytes(contentLength); //创建Frame对象
Frame frame = new Frame();
frame.setHeader(header);
frame.setContent(content); if(null != content) content.release(); return frame;
}

  这段代码,注释已经比较清晰了,这里就不再多说。

  FrameDecoder

   这个类继承了LengthFieldBasedFrameDecoder,所以只需要很少的代码就可以从Byte流中分离出数据包。

     public FrameDecoder(){
super(Frame.MAX_LENGTH, Frame.HEADER_LENGTH - 2, 2);
} @Override
protected Object decode(ChannelHandlerContext ctx, ByteBuf in) throws Exception {
//找到begin位置
int start = in.readerIndex();
int begin = in.getInt(start + 0);
if(begin != Frame.BEGIN){
dropFailedData(in);
} //解码得到Frame对象
ByteBuf dataPack = null;
try{
dataPack = (ByteBuf)super.decode(ctx, in);
Frame frame = Frame.decode(dataPack);
return frame;
}finally {
if(null != dataPack){
dataPack.release();
}
}
}

  2行,设置了数据包的最大长度Frame.MAX_LENGTH, 数据包header除contentLength之外的长度Frame.HEADER_LENGTH-2, contentLength字段的长度。这样,只要正确地找到数据包的开始位置就能LengthFieldBasedFrameDecoder就能帮助我们把数据包提取出来。

  8-12行,确定数据包的开始位置。

  17-18行,提取数据包,并把数据包反序列化成Frame。

  FMessageTrait

  为了能够灵活地处理FMessage的content, 框架中定义了FMessageTrait接口,可以使用不同个FMessageTrait实现处理不同的content类型。

 /**
* FMessage消息特征接口,根据不同的contentType进行Frame和FMessage之间的转换
*/
public interface FMessageTrait { /**
* 得到匹配的contentType
* @return contentType的值
*/
int getContentType(); /**
* 把FMessage转换成Frame
* @param fmsg
* @return
* @throws EncoderException
*/
Frame encode(FMessage fmsg) throws EncoderException; /**
* 把Frame转换成FMessage
* @param frame
* @return
* @throws DecoderException
*/
FMessage decode(Frame frame) throws DecoderException;
}

  FrameToMessageDecoder和MessageToFrameEncoder使用FMessageTrait进行FMessage和Frame之间的转换。

 /**
* 把Frame转换成FMessage
*/
@ChannelHandler.Sharable
public class FrameToMessageDecoder extends MessageToMessageDecoder<Frame> { private Map<Integer, FMessageTrait> fmTraits = new HashMap<>(); public void addFMessageTrait(FMessageTrait trait){
fmTraits.put(trait.getContentType(), trait);
} @Override
protected void decode(ChannelHandlerContext ctx, Frame frame, List<Object> out) throws Exception {
int contentType = frame.getHeader().getContentType();
FMessageTrait trait = fmTraits.get(contentType);
if(null == trait){
throw new EncoderException("can't find trait. contentType:"+contentType);
} FMessage fmsg = trait.decode(frame);
out.add(fmsg);
}
}

  10-12行,把FMessageTrait放入map中。构建contentType-FMessageTrait之间的映射。

  17行,从map中得到FMessageTrait。

  22行,使用FMessageTrait把Frame转换成FMessage。

  MessageToFrameEncoder的实现类似。不同的是在22处调用FMessageTrait的encode方法把FMessage转换成Frame。

  FMTraits中给出了几种常见的FMessageTrait实现:

  • FMTraitBytes:  处理byte array类型的content。
  • FMTraitString: 处理String类型的content。
  • FMTraitJson: 处理Json格式是content。
  • FMTraitProtobuf: 处理protobuf格式的content。

  他们都有一个共同的祖先AbstractFMTrait, 这个抽象类实现FMessageTrait的encode和decode方法,定义了两个抽象方法encodeContent和decodeContent,子类只需专注于content的处理就可以了。

  下面以FMTraitBytes为例,讲解一下FMessageTrait的具体实现。FMTraitBytes处理的FMessage类型要求conent是byte[]类型。

     public static final int BYTES = 0x01;
public static final FMessageTrait FMTBytes = new FMTraitBytes();
public static class FMTraitBytes extends AbstractFMTrait {
protected int contentType; public FMTraitBytes(){
this(BYTES);
} public FMTraitBytes(int contentType){
this.contentType = contentType;
} @Override
public int getContentType() {
return contentType;
} @Override
protected ByteBuf encodeContent(FMessage fmsg) throws EncoderException{
byte[] bytes = (byte[])fmsg.getContent(); ByteBuf buf = null;
if(null != bytes && bytes.length > 0){
buf = ByteBufAllocator.DEFAULT.buffer(bytes.length);
buf.writeBytes(bytes);
} return buf;
} @Override
protected Object decodeContent(Frame frame) throws DecoderException {
ByteBuf buf = frame.getContent();
byte[] bytes = null;
if(null != buf && buf.readableBytes() > 0){
bytes = new byte[buf.readableBytes()];
buf.readBytes(bytes);
} return bytes;
}
}

  6-17行,实现了contentType的设置和获取。

  21-29行,把FMessage的content转换成ByteBuf。

  34-42行, 发Frame的content转换成byte[]。

  FMessageHandler

  这是一个专门用来处理FMessage的ChannelInboundHandler。channelRead0方法负责把不同cmd的FMessage派发到专用方法处理,这些方法有:

  • onPing: 收到PING, 会自动响应一个PONG。
  • onPong: 收到PONG。
  • onRequest: 收到REQUEST。
  • onResponse: 收到RESPONSE。
  • onPush: 收到PUSH。

  客户端框架

  TcpConnector功能是发起连接,它的主要功能集中在以下三个方法中。

    public void addFMessageTrait(FMessageTrait trait){
fmEncoder.addFMessageTrait(trait);
fmDecoder.addFMessageTrait(trait);
} public TcpClient connect(InetSocketAddress address) throws Exception{
ChannelFuture future = bootstrap.connect(address);
Channel channel = future.channel(); TcpClient client = new TcpClient(channel, workerElg.next());
channel.attr(TcpClient.CLIENT).set(client); future.sync(); return client;
}  protected void doInitChannel(SocketChannel ch) throws Exception {
ChannelPipeline pl = ch.pipeline(); pl.addLast(H_FRAME_DECODER, new FrameDecoder());
pl.addLast(H_FRAME_ENCODER, frameEncoder); pl.addLast(H_READ_TIMEOUT, new ReadTimeoutHandler(readTimeout, TimeUnit.SECONDS)); pl.addLast(H_FM_DECODER, fmDecoder);
pl.addLast(H_FM_ENCODER, fmEncoder); pl.addLast(H_FM_HANDLER, clientHandler);
}

  addFMessageTrait设置FMessageTrait,开发者可以根据需要定制FMessage的处理能力,FMTraitBytes会默认添加。

  connect用来发起连接,创建TcpClient对象。

  doInitChannel初始化Channel, 开发者可以覆盖这个方法,定制channel的ChannelHandler。

  另外,TcpConnector内部实现了一个FMessageHandler的派生类ClientHandler。这个类的channelActive方法中启动一个定时任务定时发送PING。onResponse方法负责调用TcpClient的onResponse方法。

  TcpClient是客户端连接对象,它主要有两个方法:

  public boolean send(FMessage msg);

  public Promise<FMessage> send(FMessage msg, TimeUnit timeUnit, long timeout);

  第一个不处理响应。第二个可以异步数量响应。

  另外还有一个给TcpConnector使用的onResponse方法,用来触发第二个send返回Promise对象的回调。

  服务器端框架

  TcpServer是服务器端框架,它比较简单。开发者只需要覆盖doInitChannel,添加自己的ChannelHandler,就可以实现服务器端的定制。