最近做了些牛客上的笔试题,果然发现很多不足之处,感觉大一的C++白学了,心累QAQ。
问题:
有四个类A B C定义如下, 请确定sizeof(A),sizeof(B) ,sizeof(C),sizeof(D)的大小顺序.
class A
{
int x;
int y;
};
class B :public A
{
int x;
char y;
};
class C
{
C()
{
}
virtual ~C()
{
}
int x;
short y;
};
class D
{
int x;
char y;
};
解析:
首先补充一点内存对齐的规则。
结构体或类的的内存分配规则:
从结构体或类的首地址开始向后依次为每个成员寻找第一个满足条件的首地址x,条件为x%N==0(N为成员的自身对齐值),并且结构的长度必须为每个成员自身对齐值最大的那个值的最小整数倍,不够的话就补空字节。
结构体或类的自身对齐值为所有成员中自身对齐值最大的那个。
在32位机+32系统下
A的大小为8,很容易得出的。
B继承自A,B的起始存储大小是从第8字节开始的,B::x占4个字节,B::y从第12个字节开始,B::y占一个字节,计算得B的大小应该是13,但是根据类的对齐规则(结构体或类的自身对齐值是其成员自身对齐值最大的那个值,本题B的成员自身对齐值最大的为4(int)),所以B::y后面还要补充三个字节,B的大小为16。
C的大小为12。类C中有虚函数,包含虚函数指针,虚函数占4个字节。本来计算得大小为10,但是C的自身对齐值为4,如果C的地址空从0x0000开始,那么此时0x000A%4(对齐值)!=0,所以要在C::y后面再补充2个字节,大小变成12,0x000C%4==0。
D的大小为,和上面的计算方法差不多。
下面就正式开始介绍内存对齐了。尤其感谢这篇博客,写的很详尽。下面的内容很多都是参考这篇博客的,O(∩_∩)O!
内存对齐
概念:
对齐跟数据在内存中的位置有关。如果一个变量的内存地址正好位于它长度的整数倍,它就称为自然对齐。比如在32位cpu下,一个整型变量的地址为0x00000004,那它就是自然对齐(起始地址能被4整除)。
需要字节对齐的原因:
需要字节对齐的根本原因在于cpu访问数据的效率问题。假设上面整型的变量地址不是自然对齐,比如为0x00000002,则cpu如果取它的值的话需要访问两次内存。第一次取从0x00000002~0x00000003的一个short,第二次取从0x00000004~0x00000005的一个short然后组合得到所要的数据。如果变量在0x00000003地址上,则需要访问3次,第一次为char,第二次为short,第三次为char,然后组合得到整型数据。而如果变量地址在自然对齐位置上,只需要一次就能取得数据。除此之外,合理的利用字节对齐能有效的节省存储空间。
正确处理字节对齐
对于标准数据类型,它的地址只要是它的长度的整数倍就行了,而非标准数据类型按下面的原则对齐:
数组:按照基本数据类型对齐,第一个对齐了后面的自然也就对齐了。
联合:按其包含的长度最大的数据类型对齐。
结构体:结构体中每个数据类型都要对齐。
比如有如下一个结构体:
struct stu{
char sex;
int length;
char name[10];
};
struct stu my_stu;
由于在x86下,GCC默认按4字节对齐,它会在sex后面跟name后面分别填充三个和两个字节使length和整个结构体对齐。于是我们sizeof(my_stu)会得到长度为20,而不是15。
什么时候需要设置对齐
在设计不同CPU下的通信协议时,或者编写硬件驱动程序时寄存器的结构这两个地方都需要按一字节对齐。即使看起来本来就自然对齐的也要使其对齐,以免不同的编译器生成的代码不一样。
更改C编译器的缺省字节对齐方式
在缺省情况下,C编译器为每一个变量或是数据单元按其自然对界条件分配空间。一般地,可以通过下面的方法来改变缺省的对界条件:
· 使用伪指令#pragma pack (n),C编译器将按照n个字节对齐。
· 使用伪指令#pragma pack (),取消自定义字节对齐方式。
#pragma pack(1)
class D
{
int x;
char y;
};
此时sizeof(D)等于5。
字节对齐对程序的影响:
struct A
{
int a;
char b;
short c;
};
struct B
{
char b;
int a;
short c;
};
sizeof(struct A)=8;
sizeof(struct B)=12;
之所以出现上面的结果是因为编译器要对数据成员在空间上进行对齐。上面是按照编译器的默认设置进行对齐的结果。
下面就是最最重要的内容了。
我们想知道编译器是按什么规则对齐的。
四个重要的基本概念:
1.数据类型自身的对齐值:对于char型数据,其自身对齐值为1,对于short型为2,对于int,float,double类型,其自身对齐值为4,单位字节。
2.结构体或者类的自身对齐值:其成员中自身对齐值最大的那个值。
3.指定对齐值:#pragma pack (value)时的指定对齐值value。
4.数据成员、结构体和类的有效对齐值:自身对齐值和指定对齐值中小的那个值。
有了这些值,我们就可以很方便的来讨论具体数据结构的成员和其自身的对齐方式。有效对齐值N是最终用来决定数据存放地址方式的值,最重要。有效对齐N,就是表示“对齐在N上”,也就是说该数据的”存放起始地址%N=0”.而数据结构中的数据变量都是按定义的先后顺序来排放的。第一个数据变量的起始地址就是数据结构的起始地址。结构体的成员变量要对齐排放,结构体本身也要根据自身的有效对齐值圆整(就是结构体成员变量占用总长度需要是对结构体有效对齐值的整数倍,结合下面例子理解)。这样就不能理解上面的几个例子的值了。
例子分析:
分析例子B;
struct B
{
char b;
int a;
short c;
};
假设B从地址空间0x0000开始排放。该例子中没有定义指定对齐值,在笔者环境下,该值默认为4。第一个成员变量b的自身对齐值是1,比指定或者默认指定对齐值4小,所以其有效对齐值为1,所以其存放地址0x0000符合0x0000%1=0.第二个成员变量a,其自身对齐值为4,所以有效对齐值也为4,所以只能存放在起始地址为0x0004到0x0007这四个连续的字节空间中,复核0x0004%4=0,且紧靠第一个变量。第三个变量c,自身对齐值为2,所以有效对齐值也是2,可以存放在0x0008到0x0009这两个字节空间中,符合0x0008%2=0。所以从0x0000到0x0009存放的都是B内容。再看数据结构B的自身对齐值为其变量中最大对齐值(这里是b)所以就是4,所以结构体的有效对齐值也是4。根据结构体圆整的要求,0x0009到0x0000=10字节,(10+2)%4=0。所以0x0000A到0x000B也为结构体B所占用。故B从0x0000到0x000B共有12个字节,sizeof(structB)=12;其实如果就这一个就来说它已将满足字节对齐了,因为它的起始地址是0,因此肯定是对齐的,之所以在后面补充2个字节,是因为编译器为了实现结构数组的存取效率,试想如果我们定义了一个结构B的数组,那么第一个结构起始地址是0没有问题,但是第二个结构呢?按照数组的定义,数组中所有元素都是紧挨着的,如果我们不把结构的大小补充为4的整数倍,那么下一个结构的起始地址将是0x0000A,这显然不能满足结构的地址对齐了,因此我们要把结构补充成有效对齐大小的整数倍.其实诸如:对于char型数据,其自身对齐值为1,对于short型为2,对于int,float,double类型,其自身对齐值为4,这些已有类型的自身对齐值也是基于数组考虑的,只是因为这些类型的长度已知了,所以他们的自身对齐值也就已知了。