C语言之结构体内存的对齐

 

大纲:

   零.引例

   一.结构体内存对齐规则

   二.怎样计算结构体的大小

   三.设计结构体时要注意的方面

   四.为什么存在内存对齐

   五.修改默认对齐数

 

 

 

在前面的章节中,我们谈到了C语言中整数以及浮点数的储存

今天,我们来谈一谈一些关于结构体内存的知识。

 

我们先来看一个例子:

struct S1
{
    char c1;
    int i;
    char c2;
};

大家来猜猜这个结构体S1的内存是多少?

相信会有人给出 6 的结果,他们或许是这样想的,两个 char 类型分别为一个字节,一个 int 类型又为4个字节,加起来刚好为6个

但是

结果真是如此吗?

我们来看看运行结果:

 

 

 为什么呢,接下来我们就引出正文。

 

一.结构体内存对齐规则

首先,正如引例所示,结构体的内存并不是简简单单的将结构体各个成员的大小相加。

结构体的大小往往遵循着结构体的对齐规则:

  1. 第一个成员在与结构体变量偏移量为0的地址处。
  2. 其他成员变量要对齐到某个数字(对齐数)的整数倍的地址处。
  3. 结构体总大小为最大对齐数(每个成员变量都有一个对齐数)的整数倍。
  4. 如果嵌套了结构体的情况,嵌套的结构体对齐到自己的最大对齐数的整数倍处,结构体的整体大小就是所有最大对齐数(含嵌套结构体的对齐数)的整数倍。

这里要注意的一点就是要解释一下这个对齐数的概念

对齐数:编译器默认的一个对齐数 与 该结构体变量成员自身大小的较小值。

  注:

    不是所有的编译器都有自己默认的对齐数。

    在VS下其默认的对齐数为8

    在linux下的默认值为4

 

二.怎样计算结构体的大小

在讲计算之前,我们继续来看一看上面的那个例子:

#define _CRT_SECURE_NO_WARNINGS

#include<stdio.h>
#include<stddef.h>

struct S1
{
    char c1;
    int i;
    char c2;
};

int main()
{
    printf("该结构体成员 c1 开始的位置为第 %d 个字节\n", offsetof(struct S1, c1));
    printf("该结构体成员 i 开始的位置为第 %d 个字节\n", offsetof(struct S1, i));
    printf("该结构体成员 c2 开始的位置为第 %d 个字节\n", offsetof(struct S1, c2));
    printf("该结构体所占的内存空间为 %d 个字节\n", sizeof(struct S1));
    return 0;
}

注:

  宏 offsetof() 可以计算出结构体各成员所相对开始位置的一个偏移量。

  偏移量 :  我们可以理解为把结构体变量第一个成员所储存的第一个位置置于0,以此递增 

我们来看看结果:

 

 

 这是为什么呢?

我们来看看上面所提到的结构体内存对齐规则:

 

 

 然后我们来看示意图:

 

 

 

此时,关于结构体的大小,我们应该清楚了不少,接下来,我们继续来看几道例题:

struct S2
{
    char c1;
    char c2;
    int i;
};
int main()
{
    printf("%d\n", sizeof(struct S2));
    return 0;
 }

我们看到,S1与S2的区别仅仅只是调换了一下各成员间的顺序,那它所占的内存还是刚才的值吗:

运行结果:

 

 

 我们继续来分析一下:

 

 

 趁此机会,我们再来巩固一下:

struct S3
{
    double d;
    char c;
    int i;
};

int main()
{
    printf("%d\n", sizeof(struct S3));
    return 0;
}

它的结果会是多少呢?

 

 

 不知道大家作对了吗?

解析:

   首先 double 类型占8个字节

   char 又展览接下来的一个

   而 int 的对齐数为 4,所以空3个字节从12开始

   而这个结构体的最大对齐数为8

   所以该结构体占 2*8 = 16个字节

 

最后,我们再来看一道嵌套结构体的例题:

struct S3
{
    double d;
    char c;
    int i;
};

struct S4
{
    char c1;
    struct S3 s3;
    double d;
};

int main()
{
    printf("%d\n", sizeof(struct S4));
    return 0;
}

它的结果又为多少呢?

 

 

 解析:

  我们先来看看规则 4: 如果嵌套了结构体的情况,嵌套的结构体对齐到自己的最大对齐数的整数倍处,

            结构体的整体大小就是所有最大对齐数(含嵌套结构体的对齐数)的整数倍

   S3的最大对齐数为 8,它的大小为 16 个字节

   首先,毋庸置疑的是 char 先放到首位

   接下来因为S3的对齐数为 8,所以S3放在了以位置8开始的16个字节

   最后是double,对齐数为8,所以放在了24的位置

   最后,该结构体的大小为 4*8 = 32 个字节

 

在进行结构体所占大小的计算中,我们又可以得到一个基本编程常识:

 

三.设计结构体时要注意的方面

在我们进行结构体的设计中,我们可以把一些所占空间小的,来凑到一起,提高资源的利用率。

正如上文所提到的例1与例2,结构体成员完全相同,但顺序不同,两个结构体的大小也截然不同

//例1
struct S1
{
    char c1;
    int i;
    char c2;
};

//例2
struct S2
{
    char c1;
    char c2;
    int i;
};

int main()
{
    printf("%d\n", sizeof(struct S1));//12
    printf("%d\n", sizeof(struct S2));//8
    return 0;
}

 

四.为什么存在内存对齐

对于这个原因,目前话没有一种完全正确的答案,但是:

 

大部分的参考资料都是如是说的:

  1. 平台原因(移植原因):

    不是所有的硬件平台都能访问任意地址上的任意数据的;

    某些硬件平台只能在某些地址 处取某些特定类型的数据,否则抛出硬件异常。

   2. 性能原因:

     数据结构(尤其是栈)应该尽可能地在自然边界上对齐。

     原因在于,为了访问未对齐的内存,处理器 需要作两次内存访问;而对齐的内存访问仅需要一次访问。

 

对于原因而我们来看一个示意图:

 

 

五.修改默认对齐数

我们通常使用如下的预处理命令来修改编译器的默认对齐数:

 #pragma pack()                                                                                                                  

 

 如果()里面不加数字,则默认为编译器的默认对齐数

 我们修改的时候,只需在()里加一个数字就行

 取消的时候再添加一次 #pragma pack()  即可

注:

  再()里添加的数字,我们通常加的都是2的多少次方

 

下面来举一个实例:

#include <stdio.h>
#pragma pack(8)//设置默认对齐数为8
struct S1
{
    char c1;
    int i;
    char c2;
};
#pragma pack()//取消设置的默认对齐数,还原为默认
#pragma pack(1)//设置默认对齐数为8
struct S2
{
    char c1;
    int i;
    char c2;
};
#pragma pack()//取消设置的默认对齐数,还原为默认

int main() { //输出的结果是什么? printf("%d\n", sizeof(struct S1));//12 printf("%d\n", sizeof(struct S2));//6 return 0; }

 

由此可见,我们也可以通过修改默认对齐数来节约  结构体使用的空间。

 

 

 

关于结构体内存的讲解便到此为止。

笔者水平有限,若有错误之处,还望多多指正。

 

若有想回忆  C语言中整数以及浮点数是怎样储存的读者,可以参见 :C语言之数据在内存中的存储