● 字节序的定义
字节序,顾名思义字节的顺序,再多说两句就是大于一个字节的数据在内存中的存放顺序(一个字节的数据当然就无需谈顺序的问题)。
在大部分的开发中我们不需要考虑字节序的问题。唯有在跨平台以及网络程序应用中字节序才是一个应该被考虑的问题。
● 网络应用的字节序
网络字节序是TCP/IP规定好的一种数据表示格式,它与具体的CPU类型、操作系统无关,从而可以保证数据在不同主机之间传输时能被正确解释。网络字节顺序采用bigendian排序方式。
在网络编程时,并不是什么时候都要考虑字节序问题。那么什么时候需要考虑呢?
Intel CPU使用的都是littleendian。
实际上如果是应用层的数据,即对TCP/IP来说是透明的数据,不用考虑字节序的问题。因为接收端收到的顺序是和发送端一致的。
但对于TCP/IP关心的数据(IP地址、端口)来说就不一样了。
例如我指定了一个端口号:
unsigned short port = 0x0012 (十进制18)
把这个端口号传个TCP/IP建立一个socket连接。
sockaddr_in addr;
addr.sin_family = AF_INET; //使用互联网际协议,即IP协议
addr.sin_port = port;
addr.sin_addr.S_un.S_addr = htonl(INADDR_ANY);
因为网络字节序是big endian,即低地址存放的是数值的高位,所以TCP/IP实际上把这个port解释为0x1200(十进制4608)。本来打算是要在端口18建立连接的,但TCP/IP协议栈却在端口4608建立了连接。
当一个数据是应用层和TCP/IP都需要关心的时候,需要考虑这个数据的字节序(一般而言就是IP地址和端口号)。
我觉得网络字节序的问题其实可以隐藏在TCP/IP中的,不知道为什么没有那么做?
● 字节序转换函数
htons 把 unsignedshort 类型从主机序转换到网络序
htonl 把 unsignedlong 类型从主机序转换到网络序
ntohs 把 unsignedshort 类型从网络序转换到主机序
ntohl 把 unsignedlong 类型从网络序转换到主机序
这几个函数很好记,比如htons中hton代表host to network, s代表unsignedshort
char FAR * inet_ntoa( struct in_addr in);
将一个IP转换成一个互联网标准点分格式的字符串。
in_addr_t inet_addr(const char *cp);
将一个点分十进制的IP转换成一个长整数型数(u_long类型)。返回值已是网络字节顺序,可以直接作为internet 地址