web开发基础--字节序

时间:2024-06-14 23:34:26

字节是网络传输上的最小单位,是web开发中需要了解的一个知识点。

1.有效位

在谈字节序前需要先了解有效位,有效位分为两种:最低有效位(LSB: Least Significant Bit) 和最高有效位(MSB:Most Significant Bit)。在二进制数中,LSB是最低加权位,与十进制数字中最右边的一位类似;MSB是最高加权位,与十进制数字中最左边的一位类似。通常,MSB位于二进制数的最左侧,LSB位于二进制数的最右侧。以一个十进制的数12345678为例,最高有效位就是1,最低有效位就是8。

2.字节序:

字节序,顾名思义字节的顺序,就是大于一个字节类型的数据在内存中的存放顺序(一个字节的数据当然就无需谈顺序的问题了)。字节序分为两类:Big-Endian和Little-Endian,具体定义入下:

a) Little-Endian就是低位字节排放在内存的低地址端,高位字节排放在内存的高地址端。

b) Big-Endian就是高位字节排放在内存的低地址端,低位字节排放在内存的高地址端。

用文字说明可能比较抽象,下面用图像加以说明。比如数字0x12345678在两种不同字节序CPU中的存储顺序如下所示:

web开发基础--字节序

从上面两图可以看出,采用big endian方式存储数据是符合我们人类的思维习惯的。

为什么要注意字节序的问题呢?你可能这么问。当然,如果你写的程序只在单机环境下面运行,并且不和别人的程序打交道,那么你完全可以忽略字节序的存在。但是,如果你的程序要跟别人的程序产生交互呢?在这里我想说说两种语言。C/C++语言编写的程序里数据存储顺序是跟编译平台所在的CPU相关的,而JAVA编写的程序则唯一采用big endian方式来存储数据。试想,如果你用C/C++语言在x86平台下编写的程序跟别人的JAVA程序互通时会产生什么结果?就拿上面的0x12345678来说,你的程序传递给别人的一个数据,将指向0x12345678的指针传给了JAVA程序,由于JAVA采取big endian方式存储数据,很自然的它会将你的数据翻译为0x78563412。什么?竟然变成另外一个数字了?是的,就是这种后果。因此,在你的C程序传给JAVA程序之前有必要进行字节序的转换工作。

3.Big-Endian和Little-Endian优缺点

Big-Endian优点:判别一个数的正负很容易,只要取offset0处的一个字节就能确认。你不必知道这个数值有多长,或者你也不必过一些字节来看这个数值是否含有符号位。这个数值是以它们被打印出来的顺序存放的,所以从二进制到十进制的函数特别有效。

Little-Endian优点:长度为1,2,4字节的数,排列方式都是一样的,数据类型转换非常方便。提取一个,两个,四个或者更长字节数据的汇编指令以与其他所有格式相同的方式进行:首先在偏移地址为0的地方提取最低位的字节,因为地址偏移和字节数是一对一的关系,多重精度的数学函数就相对地容易写了。

如果你增加数字的值,你可能在左边增加数字(高位非指数函数需要更多的数字)。因此,经常需要增加两位数字并移动存储器里所有Big-endian顺序的数字,把所有数向右移,这会增加计算机的工作量。不过,使用Little- Endian的存储器中不重要的字节可以存在它原来的位置,新的数可以存在它的右边的高位地址里。这就意味着计算机中的某些计算可以变得更加简单和快速。

4.JAVA字节序

BIG-ENDIAN、LITTLE-ENDIAN跟多字节类型的数据有关,比如int,short,long型,而对单字节数据byte却没有影响。BIG-ENDIAN就是低位字节排放在内存的高端,高位字节排放在内存的低端。而LITTLE-ENDIAN正好相反。

比如 int a = 0x05060708

在BIG-ENDIAN的情况下存放为:

字节号 0 1 2 3

数据 05 06 07 08

在LITTLE-ENDIAN的情况下存放为:

字节号 0 1 2 3

数据 08 07 06 05

5.网络字节序:

无独有偶,所有网络协议也都是采用big endian的方式来传输数据的。所以有时我们也会把big endian方式称之为网络字节序。当两台采用不同字节序的主机通信时,在发送数据之前都必须经过字节序的转换成为网络字节序后再进行传输。

6.JAVA示例:

我们首先看下java默认byteorder下的结果:

  1: public static void byteOrderForIntTest(){
  2:         ByteBuffer buf =ByteBuffer.allocate(10);
  3:         System.out.println("Default java endian: "+buf.order().toString());
  4:
  5:         buf.putInt(1);
  6:         buf.putInt(2);
  7:
  8:         buf.flip();
  9:         for(int i=0;i<buf.limit();i++){
 10:             System.out.println(buf.get());
 11:         }
 12:     }

执行结果为:

web开发基础--字节序

然后我们再修改下byteOrder:

  1: public static void byteOrderForIntTest(){
  2:         ByteBuffer buf =ByteBuffer.allocate(10);
  3:         System.out.println("Default java endian: "+buf.order().toString());
  4:
  5:         buf.order(ByteOrder.LITTLE_ENDIAN);
  6:         System.out.println("now java endian: "+buf.order().toString());
  7:
  8:         buf.putInt(1);
  9:         buf.putInt(2);
 10:
 11:         buf.flip();
 12:         for(int i=0;i<buf.limit();i++){
 13:             System.out.println(buf.get());
 14:         }
 15:     }

执行结果为:

web开发基础--字节序

参考资料:

2.http://baike.baidu.com/link?url=H235MhpFB3PN_DX_ke6CVKqKuXWDprMDLoT6iuwJYP10vMGJNYdgG_mn5lw1gc-bkaRRXXPnNn_toQl5oSTQKK