TCP、UDP通信 Big或Little Edian字节顺序(大小端)问题的解决

时间:2022-11-18 19:01:00


项目中才知道TCP、UDP通信的字节集合要求是Big Edian而计算机的处理可能是Little Edian 导致问题。

1、关于Big或Little Edian字节顺序的具体解释

字节顺序 Endian

现代的计算机系统一般采用字节(Octet, 8 bit Byte)作为逻辑寻址单位。当物理单位的长度大于1个字节时,就要区分字节顺序(Byte Order, orEndianness)。常见的字节顺序有两种:Big Endian(High-byte first)和Little Endian(Low-byte first),这就是表2.1中的BELE。Intel X86平台采用Little Endian,而PowerPC处理器则采用了Big Endian。举例来说,整型数字$1234ABCD存储的时候就会有两种方式:

 

字节顺序

内存数据

备注

Big Endian (BE)

0xAB 0xCD 0x12 0x34

此时的0xAB被称为most significant byte (MSB)

Little Endian (LE)

0xCD 0xAB 0x34 0x12

此时的0xCD被称为least significant byte (LSB)

词源:据Jargon File记载,endian这个词来源于Jonathan Swift在1726年写的讽刺小说 "Gulliver's Travels"(《格利佛游记》)。该小说在描述Gulliver畅游小人国时碰到了如下的一个场景。在小人国里的小人因为非常小(身高6英寸)所以总是碰到一些意想不到的问题。有一次因为对水煮蛋该从大的一端(Big-End)剥开还是小的一端(Little-End)剥开的争论而引发了一场战争,并形成了两支截然对立的队伍:支持从Big-End剥开的人Swift就称作Big-Endians而支持从Little-End剥开的人就称作Little-Endians……(后缀ian表明的就是支持某种观点的人:-)。Endian这个词由此而来。

  1980年,Danny Cohen在其著名的论文"On Holy Wars and a Plea for Peace"中为了平息一场关于在消息中字节该以什么样的顺序进行传送的争论而引用了该词。该文中,Cohen非常形象贴切地把支持从一个消息序列的MSB开始传送的那伙人叫做Big-Endians,支持从LSB开始传送的相对应地叫做Little-Endians。此后Endian这个词便随着这篇论文而被广为采用。

TCP、UDP通信 Big或Little Edian字节顺序(大小端)问题的解决

Mapping registers to memory locations

最高有效位 MSB: Most Significant Bit

       最高有效位(MSB),有时候叫做最左边的位,是在一个n位二进制数字中的n-1位,这个位有最高的权重(2^(n-1))。第一个或最左边的位,当这个数字被用一般的方式书写时。

最低有效位 LSB: Least Significant Bit

       最低有效位(LSB)是给这些单元值的一个二进制整数位位置,就是,决定是否这个数字是偶数或奇数。LSB有时候是指最右边的位,因为写较不重要的数字到右边位置符号的协定。它类似于一个十进制整数的最不重要的数字,它是在一个(最右边)位置的数字。

大端Big-Endian

低地址存放最高有效位(MSB),既高位字节排放在内存的低地址端,低位字节排放在内存的高地址端。

计算机体系结构中一种描述多字节存储顺序的术语,在这种机制中最高有效位(MSB)存放在最低端的地址上。采用这种机制的处理器有IBM3700系列、PDP-10、Mortolora微处理器系列和绝大多数的RISC处理器。

TCP、UDP通信 Big或Little Edian字节顺序(大小端)问题的解决

小端Little-Endian

       低地址存放最低有效位(LSB),既低位字节排放在内存的低地址端,高位字节排放在内存的高地址端。

计算机体系结构中一种描述多字节存储顺序的术语,在这种机制中最不重要字节(LSB)存放在最低端的地址上。采用这种机制的处理器有PDP-11、VAX、Intel系列微处理器和一些网络通信设备。该术语除了描述多字节存储顺序外还常常用来描述一个字节中各个比特的排放次序。

TCP、UDP通信 Big或Little Edian字节顺序(大小端)问题的解决

中端 Middle-Endian

除了big-endian和little-endian之外的多字节存储顺序就是middle-endian,比如以4个字节为例:象以3-4-1-2或者2-1-4-3这样的顺序存储的就是middle-endian。这种存储顺序偶尔会在一些小型机体系中的十进制数的压缩格式中出现。

网络字节序 Network Order

TCP/IP各层协议将字节序定义为Big-Endian,因此TCP/IP协议中使用的字节序通常称之为网络字节序。

主机序 Host Orader

它遵循Little-Endian规则。所以当两台主机之间要通过TCP/IP协议进行通信的时候就需要调用相应的函数进行主机序(Little-Endian)和网络序(Big-Endian)的转换。

 

2、C#提供的BitConverter的判断处理

 

        /// <summary>
        /// 获得Int16的值
        /// </summary>
        /// <param name="data"></param>
        /// <returns></returns>
        private static Int16 getInt16(byte[] data)
        {
            if (BitConverter.IsLittleEndian)
            {
                return BitConverter.ToInt16(getConvertEdian(data), 0);
            }
            else
            {
                return BitConverter.ToInt16(data, 0);
            }
        }
3、getConvertEdian

        /// <summary>
        /// 转换Big或Little Edian字节顺序
        /// </summary>
        /// <param name="data"></param>
        /// <returns></returns>
        private static byte[] getConvertEdian(byte[] data)
        {
            int len = data.Length;
            byte[] result = new byte[len];
            for (int i = 0; i < len; i++)
            {
                result[i] = data[len - i - 1];
            }
            return result;
        }

 

试用请登录http://121.18.78.216/