深入学习Motan系列(五)—— 序列化与编码协议

时间:2023-05-27 22:07:26

一、序列化

1.什么是序列化和反序列化?

序列化:将对象变成有序的字节流,里面保存了对象的状态和相关描述信息。

反序列化:将有序的字节流恢复成对象。

一句话来说,就是对象的保存与恢复。

为什么需要这个东西。它的作用呢,就是持久化(比如讲内容保存在计算机上)和进程间传递。因为计算机是二进制的,网络间传输东西也是通过二进制来传递的,所以需要将对象变成bytes再进行传递。

2.序列化的使用

使用序列化的demo,我不写了,网上一堆。里面用到的ObjectOutputStream很重要,我们看看它的介绍(当然去看JDK的文档了,最权威)

地址如下:https://docs.oracle.com/javase/8/docs/api/

中文版:https://blog.fondme.cn/apidoc/jdk-1.8-google/

只用继承了Serializable接口的类才能被写进字节流中(进行序列化),序列化编码时包含的内容有:类名,类签名,对象字段的值和数组,以及初始化对象引用的closure(汉语没想到怎么表达它)。默认的序列化机制可以写入对象,类签名,所有non-transient和non-static的字段。

默认的序列化机制使用:继承Serializable接口,就可以使用了;若是想自定义序列化机制(出于信息安全和效率的目的),需要实现下面的方法:readObject() writeObject()

readObjectNoData()。实现Externalizable接口可以完全控制对象序列化内容和格式(目前,我没见过Externalizable接口,稍后,尝试分析hession序列化协议,看看里面是否会有这个接口)。

3.序列化步骤

序列化算法步骤如下:
◆将对象实例相关的类元数据输出。【元数据】
◆递归地输出类的超类描述直到不再有超类。【超类描述】
◆类元数据完了以后,开始从最顶层的超类开始输出对象实例的实际数据值。【超类-类的实际数据值】
◆从上至下递归输出实例的数据【实例数据值】

(序列化步骤这部分,摘自https://blog.csdn.net/suyebiubiu/article/details/78780941)

4.序列化协议之间比较

推荐文章:https://tech.meituan.com/serialization_vs_deserialization.html

(上面这篇文章写的确实非常好,此外,自己没有用过那么多的序列化协议,它们之间的好坏,无法做出衡量判断。每篇博文的记录,可以看作是知识的分享,更重要的是记录自己学习的脚印)

5.Hession序列化方式

Motan中使用的是Hession协议进行序列化的。接下来,走一遍,看看Hession的使用和里面的东西。

 public class Demo {

     public static void main(String args[]) throws IOException, InstantiationException, IllegalAccessException {
UserInfo user = new UserInfo();
user.setUsername("hello world");
user.setPassword("buzhidao");
user.setAge(21); ByteArrayOutputStream os = new ByteArrayOutputStream();
//Hessian的序列化输出
HessianOutput ho = new HessianOutput(os);
         // 关键内容在下面这一行中
ho.writeObject(user); byte[] userByte = os.toByteArray();
ByteArrayInputStream is = new ByteArrayInputStream(userByte); //Hessian的反序列化读取对象
HessianInput hi = new HessianInput(is);
UserInfo u = (UserInfo) hi.readObject();
System.out.println("姓名:" + u.getUsername());
System.out.println("年龄:" + u.getAge()); }
}
ho.writeObject(user);
   public void writeObject(Object object)
throws IOException
{
if (object == null) {
writeNull();
return;
} Serializer serializer;
10 // 这里是一个工厂方法,依据被序列化内容的不同(是int,还是String,是long,还是其他Object,.etc)来选择合适的序列化器
// 最后经过一系列的处理,返回UnsafeSerializer
serializer = _serializerFactory.getSerializer(object.getClass()); serializer.writeObject(object, this);
}

然后,来到下面的处理(中间过程代码有省略)

 protected void writeObject10(Object obj, AbstractHessianOutput out)
throws IOException
{
for (int i = 0; i < _fields.length; i++) {
      // 利用前面初始化时,已经确认的字段对应的序列化器,分别对字段的值进行序列化
// 比如,String类型的字段,用StringFieldSerializer序列化器来处理
Field field = _fields[i]; out.writeString(field.getName()); _fieldSerializers[i].serialize(out, obj);
} out.writeMapEnd();
}

到这里,基本算是完成序列化的过程。我们看到的很简单,其实,内部的对底层的处理比较复杂,比如,序列化时,如何生成体积更小的byte,到底为什么速度更快等。这些问题,不在本文讨论范围内。

6.问题

在网上看到一个小列子,代码跟上文中的Demo 代码一样,区别在与:父类有三个属性,子类有一个同名属性。

 public class UserInfo extends User {     private String username ;
}
 public class User implements Serializable {
private String username ;
private String password;
private Integer age;
}

这样的话,用demo例子进行序列化与反序列化的时候,发现发序列化之后,demo中21行,u.getUsername()的值为null。这个原因不是出在序列化这里,而是由于java内部机制,具体原因正在调查中,有知道的,望前辈赐教。

二、Motan编码协议

首先,复习一下基础知识:

字     word
字节  byte
位     bit
字长是指字的长度

1字节=8位(1 byte = 8bit)           一个字节的字长是8
1字=2字节(1 word = 2 byte)      一个字的字长为16
 -----------------------------------------------------------------------------------

数据协议= 协议头 + 协议体

header:  16个字节
 0-15 bit     :  magic(魔法数字)
16-23 bit    :  version (版本号)
24-31 bit    :  extend flag , 其中: 29-30 bit: event 可支持4种event,比如normal, exception等,  31 bit : 0 is request , 1 is response
32-95 bit    :  request id
96-127 bit  :  body content length

body部分就是利用序列化协议将request变成bytes[]

最后,head+body,两者进行结合,通过Netty进行传输。