C语言中的数据对齐

时间:2022-09-09 19:48:38

数据对齐的目的,是用空间换时间,提高效率.

对齐本身并不难理解,但是有这么一个古怪的命令#pragma pack()存在,它可以人为指定按几个字节来对齐.有了这个命令,就让情况变得更加复杂了.

网上有很多#pragma pack()命令的使用方法总结,但我不认为这个命令是必要的,应该尽量避免使用.

如果你的代码里使用了#pragma pack(),会导致sizeof()取得预料外的值,导致程序出错.这个错误并不容易发现.

#pragma pack()能让你的内存存储变紧凑,但会让sizeof()变得诡异,值得么?不值.

(也许写程序传输协议时需要#pragma pack()来防止结构体中出现空洞?很牵强,我不认为这是必须的.)

干脆,抛开#pragma pack()命令,简简单单来理解数据对齐吧.

对齐表明了数据在内存中的存放方式,内存的最小单位是1字节,对齐长度为1说明数据可以存储在任何内存地址.对齐长度为2说明只能存放在能被2整除的内存地址.对齐长度是4只能存放在能被4整除的内存地址.对齐长度只能是2的幂,也就是1,2,4,8,16...

数据对齐只会影响到结构体(或联合),归纳起来有如下两个规则:

1.结构体外的数据类型,它们按照自身大小来对齐.比如char型对齐长度是1,int型对齐长度是4,double型对齐长度是8.(32位系统下一般是这样).

2.结构体本身也有一个对齐长度,这个值是内部成员中自身对齐长度最大的那个值.结构体需按自身对齐长度对齐,换句话说,结构体大小必须是本身对齐长度的整数倍.

根据上面两条,你就会算结构体的大小了.

例1:

struct A
{
    char a;
    long b;
    char c;
    double d;
};

分析:

sizeof(struct A)=24.a占一个字节,b对齐长度是4,所以a后面补三个字节的洞后再存b.紧跟着是c占一个字节,d的对齐长度是8,所以c后面补7个字节的洞后再存d.共24字节.

struct A本身的对齐长度是8.

例2:

struct B
{
    char a;
    char b;
    long c;
    double d;
};

 分析:

sizeof(struct B)=16.a占一个字节,b也占一个字节.c对齐长度是4,所以b后补两个字节洞后存c.d对齐长度是8,前面abc加起来恰好8字节,所以d可以紧跟c存放.共16字节.

struct B本身的对齐长度是8.

例3:

struct C
{
  char a[123];
  int b;
  float c;
  double d;
};

分析:

sizeof(struct C)=144.a占123个字节,后补一个字节洞后存4字节的b,此时地址仍然能被4整除,所以紧跟着存4字节的c,目前总长度132,补4字节洞后存入8字节的d.总大小144字节.

等等!有疑问!

char a[123]的对齐长度是1还是123?是1.数组并非一种数据类型,这个数组的数据类型是char,char的对齐长度是1.

所以,struct C的自身对齐长度是8,144是8的整数倍,没问题.

例4:

struct D
{
  struct x
  {
    char a;
    int b;
    float c;
   }X;
  int d;
  char e;
};

分析:

sizeof(struct D)=20.先看struct x.a一个字节,补三个字节洞后跟4字节的b,之后是4字节的c.X的长度是12字节.struct x的自身对齐长度是4.再看struct D,X12字节,后跟4字节的d,之后是1个字节的e.struct D的自身对其长度是4(不是12,想一想吧).所以e后面要补三个字节洞.总长度是12+4+4=20.

例5:

struct E
{
  union y
  {
    char a;
    double b;
    int c;
  }Y;
  int d;
  double e;
};

分析:

sizeof(struct E)=24.Y是一个联合,联合的特点是它会占用跟最大的内部成员相同的空间,double最大,所以union y的对齐长度是8.之后是4字节的d.8+4=12为了对齐后面是8字节的e,d后面要补4字节的洞.所以总长度是8+8+8=24.

数据对齐基本就讲完了,描述不是特别清楚,还请见谅.

在网上,看到有人提出了如下的疑问,请试试看能否替他解答一下呢?

Struct A
{
  char a,b;
  char arr[5];
}
//这个sizeof(A)=7.。1+1+5 = 7.。对齐单位为1字节。这个可以理解。

Struct B
{
  int a,b;
  char arr[5];
}
//这个sizeof(B) = 16.. 是怎么对齐的? 数组占了8个字节?。为什么?

 分析:

struct A自身的对齐长度是1,所以sizeof(struct A)=7这很容易理解.

struct B呢?自身的对齐长度是4,a+b+arr的长度是4+4+5=13,13不能被4整除(或者说13没有按照自身对其长度对齐),所以要在最后补3个字节的洞变成16.

 

补充,如果考虑#pragma pack那么规则如下:

1)数据类型自身的对齐值:就是上面交代的基本数据类型的自身对齐值。

2)指定对齐值:#pragma pack (value)时的指定对齐值value。

3)结构体或者类的自身对齐值:其成员中自身对齐值最大的那个值。

4)数据成员、结构体和类的有效对齐值:自身对齐值和指定对齐值中较小的那个值。

另外,在GCC中,#pragma pack的默认值是4,vc中默认值是8.这一点差别会带来天差地别的不同,gcc里任何double类型都是按4字节对齐的.