C/C++中struct/union/class内存对齐

时间:2022-09-05 11:45:57

struct/union/class内存对齐原则有四个:

1).数据成员对齐规则:结构(struct)(或联合(union))的数据成员,第一个数据成员放在offset为0的地方,以后每个数据成员存储的起始位置要从该成员大小或者成员的子成员大小(只要该成员有子成员,比如说是数组,结构体等)的整数倍开始(比如int在32位机为4字节, 则要从4的整数倍地址开始存储),基本类型不包括struct/uinon/class。

2).结构体作为成员:如果一个结构里有某些结构体成员,则结构体成员要从其内部"最宽基本类型成员"的整数倍地址开始存储.(struct a里存有struct b,b里有char,int ,double等元素,那b应该从8的整数倍开始存储.)。

3).收尾工作:结构体的总大小,也就是sizeof的结果,.必须是其内部最大成员的"最宽基本类型成员"的整数倍.不足的要补齐.(基本类型不包括struct/class/uinon)。

4).sizeof(union),以结构里面size最大元素为union的size,因为在某一时刻,union只有一个成员真正存储于该地址。

 

实例解释:下面以class为代表

No.1

class Data
{
char c;
int a;
};

cout << sizeof(Data) << endl;

No.2

class Data
{
char c;
double a;
};

cout << sizeof(Data) << endl;

显然程序No.1 输出的结果为 8    No.2 输出的结果为 16 .

No.1最大的数据成员是4bytes,1+4=5,补齐为4的倍数,也就是8。而No.2为8bytes,1+8=9,补齐为8的倍数,也就是16。

 

No.3

class Data
{
char c;
int a;
char d;
};

cout << sizeof(Data) << endl;

No.4

class Data
{
char c;
char d;
int a;
};

cout << sizeof(Data) << endl;


No.3运行结果为 12 

No.4运行结果为 8

class中的数据成员放入内存的时候,内存拿出一个内存块来,数据成员们排队一个一个往里放,遇到太大的,不是把自己劈成两半,能放多少放多少,而是等下一个内存块过来。这样的话,就可以理解为什么No.3,No.4两端的代码输出结果不一样了,因为左边是1+(3)+4+1+(3)=12,而右边是1+1+(2)+4=8。括号中为补齐的bytes。

  

No.5

class BigData
{
char array[33];
};

class Data
{
BigData bd;
int integer;
double d;
};

cout << sizeof(BigData) << " " << sizeof(Data) << endl;

No.6

class BigData
{
char array[33];
};

class Data
{
BigData bd;
double d;
};

cout << sizeof(BigData) << " " << sizeof(Data) << endl;

No.5和No.6运行结果均为: 48

在默认条件下,内存对齐是以class中最大的那个基本类型为基准的,如果class中有自定义类型,则递归的取其中最大的基本类型来参与比较。在No.5和No.6中内存块一个接一个的过来接走数据成员,一直到第5块的时候,BigData里只剩1个char了,将它放入内存块中,内存块还剩7个bytes,接下来是个int(4bytes),能够放下,所以也进入第5个内存块,这时候内存块还剩3bytes,而接下来是个double(8bytes),放不下,所以要等下一个内存快到来。因此,No.5的Data的size=33+4+(3)+8=48,同理No.6应该是33+(7)+8=48。

 

顺便提一下Union: 共用体表示几个变量共用一个内存位置,在不同的时间保存不同的数据类型和不同长度的变量。在union中,所有的共用体成员共用一个空间,并且同一时间只能储存其中一个成员变量的值。

以上内容部分转载自http://www.cnblogs.com/biyeymyhjob/archive/2012/09/07/2674992.html


 

拓展:

一、32位操作系统下各种数据类型所占的字节数

1、整型

      int                         4字节                      

      long int                  4字节

      short int                   2字节

      unsigned long int     4字节

      unsigned short int    2字节

2、字符型

      char                          1字节

      unsigned char           1字节

3、浮点型

      float                              4字节

      double                          8字节

      long double                  8字节

      unsigned long double   8字节

      unsigned double           4字节

4、字符串型

      string                           32字节

5、指针类型

      所有类型的指针都是 4字节 (但是在64位下为8字节)

二、字节对齐原则

在系统默认的对齐方式下:每个成员相对于这个结构体变量地址的偏移量正好是该成员类型所占字节的整数倍,且最终占用字节数为成员类型中最大占用字节数的整数倍。

 

三、C++类中的数据成员也遵循以上对齐原则,即:

1.在不考虑(或者说在没有)虚函数和虚继承的情况下,sizeof(自定义类)也按照类似上面的方式来计算。

2.但如果一个类拥有虚函数或者虚继承,则在数据成员的基础上相当于多一个指针类型的数据成员(位置在所有数据成员的前面),最后计算时加上即可。

3.静态(static)成员不在计算范围。

[简言之,类的大小与成员变量(非static数据成员变量)和虚函数指针有关(注意:虚函数中有一个指向虚函数列表的指针,无论有多少个虚函数都是占用一个字节的大小)]

4.如果一个类或者结构体不含有任何数据成员,且无虚函数以及虚继承,则sizeof()结构为1。

 

四、为什么要进行字节对齐?

   《Windows核心编程》里这样说:当CPU访问正确对齐的数据时,它的运行效率最高,当数据大小的数据模数的内存地址是0时,数据是对齐的。例如:WORD值应该是总是从被2除尽的地址开始,而DWORD值应该总是从被4除尽的地址开始,数据对齐不是内存结构的一部分,而是CPU结构的一部分。当CPU试图读取的数值没有正确的对齐时,CPU可以执行两种操作之一:产生一个异常条件;执行多次对齐的内存访问,以便读取完整的未对齐数据,若多次执行内存访问,应用程序的运行速度就会慢。

 

可参考webary的blog:http://www.cnblogs.com/webary/p/4721017.html