C/C++: C++位域和内存对齐问题

1. 位域：

1. 在C中，位域可以写成这样（注：位域的数据类型一律用无符号的，纪律性）。

 struct bitmap

 {

 　　unsigned a : ;

 　　unsigned b : ;

 　　unsigned c : ;

 }bit;

　　sizeof(bitmap) == 4;（整个struct的大小为4，因为位域本质上是从一个数据类型分出来的，在我们的例子中数据类型就是unsigned，大小为4，并且位域也是满足C和C++的结构体内存对齐原则的，等下我们会说到）。

2. 当然了位域也可以有空域。

 struct bitmap

 {

 　　unsigned a:;

 　　unsigned :; /*空域*/

 　　unsigned b:; /*从下一单元开始存放*/

 　　unsigned c:;

 }

 sizeof(bitmap) == ;

3. 在这个位域定义中，a占第一字节的4位，后4位填0表示不使用，b从第二字节开始，占用4位，c占用4位。这里我们可以看到空域的作用是填充数据类型的剩下的位置，有时候我们只是想调整一下内存分配，则我们可以使用无名位域：

 struct bitmap

 {

 　　unsigned a:;

 　　unsigned :;

 　　unsigned b:;

 　　unsigned c:;

 };

 sizeof(bitmap) == ;

4. 如果一个位域的位的分配超过了该类型的位的总数，则从下一个单元开始继续分配，这个很好理解：

 struct bitmap

 {

 　　unsigned a : ;

 　　unsigned b : ;

 　　unsigned c : ;

 };

 sizeof(bitmap) == ;

　　注意这个位域的大小是12而不是8，说明如果超了大小是立马从下一个单元开始分配而不是cast在后面。

5. C++的位域：

　　由于C++有类，所以呢位域可以写进类里面，很简单比如：

 class Demo

 {

 　　unsigned mode : ;

 　　unsigned modeifed : ;

 　　unsigned protA : ;

 　　unsigned protB : ;

 public:

 ...

 };

　　另外就是需要注意的是，取地址运算符不能作用于位域，所以任何指针都无法指向类的位域，访问位域的方法和访问类的成员的方法一样，这里就不多说了。

2. 内存对齐：

1. 说到位域就不得说下内存对齐的东西，其实内存对齐也很简单，只是不同的编译器实现不一样，至于为什么要内存对齐，这个要从CPU的基本工作原理说起，但是首先要明白，无论我们是否内存对齐，CPU大多数情况都是能正常工作的（前提：对于大多数IA32指令都可以这么说，但是部分指令，如SSE多媒体指令这些就不行，这些指令有特殊内存对齐要求，比如16字节对齐，任何不满足内存对齐的地址访问储存器都是会导致异常，对于这些指令，编译器必须在编译的时候采取强制内存对齐）。

　　实现内存对齐可以提高CPU的性能，比如处理器能一次取出8个字节，这个时候必须要求数据地址要8字节对齐，这个是和CPU和储存器的外围电路决定的，在内存对齐的情况下，CPU从储存器取出这8个字节只需要一个时钟周期，但是如果这个地址不是8字节对齐，那么CPU可能就需要两个时钟周期才能取出这8个字节。

　　对于IA32，每个栈帧都惯例16字节对齐，编译器一般也会那么做，但是对于数据类型不同的编译器表现可能不一样，对于Windows（VC编译器），任何K字节的基本对象的地址都必须是K的倍数（比如对于int，必须4字节对齐，对于double，必须8字节对齐），这很大程度上提高了储存器和CPU的工作性能，但是对存储空间的浪费比较严重；对于Linux，惯例是8字节数对齐4字节边界（比如double可以4字节对齐）。对于Windows好Linux，数据类型long double都有4字节对其的要求，对于GCC，long double分配12字节（虽然它只占10字节大小）。

　　所以我们有一般规则（在知乎找了个例子）：

 struct X

 {

 　　char a;

 　　float b;

 　　int c;

 　　double d;

 　　unsigned e;

 };

 sizeof(X) == ;

　　内存对齐状况应该是下面这个样子：

 struct X

 {

 　　char a; // 1 bytes

 　　char padding1[]; // 3 bytes

 　　float b; // 4 bytes

 　　int c; // 4 bytes

 　　char padding2[]; // 4 bytes

 　　double d; // 8 bytes

 　　unsigned e; // 4 bytes

 　　char padding3[]; // 4 bytes

 };

 sizeof(X) == ;

　　（其中最后的4个字节的填充是因为规则4，看下面）。

2. 如果自定义数据类型含有位域，则内存对齐满足以下原则：

　　1. 如果相邻的位域的数据类型相同，则按照分配位的大小来，详情看我上面写的位域的第5个情况。

　　2. 如果相邻的位域的数据类型不相同，则不同编译器实现不一样，有些编译器选择不压缩。

　　3. 如果位域不连续，中间含非位域，则按标准数据类型大小划分，比如：

 struct bitmap

 {

 　　unsigned a : ;

 　　int b;

 　　unsigned c : ;

 };

 sizeof(bitmap) == ;

3. 另外可以通过添加#pragma pack(n)来强制改变内存分配情况，比如在VC编译器中：

 struct bitmap

 {

 　　unsigned a;

 　　double c;

 };

 sizeof(bitmap) == ;

　　加了#pragma pack(4)，则强制内存对齐4字节，再测试下其大小：

 #pragma pack(4)

 struct bitmap

 {

 　　unsigned a;

 　　double c;

 };

 sizeof(bitmap) == ;

　　当然，如果#pragma pack(n)的n大于本身数据类型的宽度，则按数据类型的宽度来分配：

 struct bitmap

 {

 　　double c;

 　　int k;

 　　int m;

 };

 sizeof(bitmap) ==  ！=

4. 自定义类型（C结构体，C++聚合类）的最后的内存对齐，是按照自定义类型内的最大类型的宽度来的，比如上面那个例子去掉int m：

 struct bitmap

 {

 　　double c;

 　　int k;

 };

 sizeof(bitmap) ==

　　必须以double进行8字节对齐（VC编译器）。

5. 对于C++如果类内有虚函数，则如果存在虚函数，则需要添加一个指针的大小（因为需要一个指针指向虚函数指针表，注意如果存在多个虚函数，也只有一个指向虚函数表指针），比如在32位系统则为4字节，在64位则为8字节。

 class Test

 {

 public:

     virtual void Hi();

     int c;

     double d;

 };

 sizeof(Test) == （IA32）或者 （x86-）

　　特别的，在C++内，空类大小为1（C++不允许0的内存空间）。

class Test

{

};

sizeof(Test) == ;

6. 如果一个类（结构体）A内嵌套着另一个类（结构体）B，则B按B内的最大类型的方式对齐，A的对齐要考虑B（总大小的对齐要考虑B的最大类型）

 class A

 {

     double c;

 public:

     class B

     {

         int i;

         double c;

     }b;

     int d;

 };

 sizeof(A) ==    sizeof(A::B) ==

7. C++的类静态成员不会被sizeof计算，这个要注意：

class C

{

public:

    static char b;

    static int *c;

};

sizeof(C)的结果是1

秒客网

C/C++: C++位域和内存对齐问题

相关文章