从汇编看c++的虚拟继承以及其内存布局(一)

时间:2024-01-15 08:56:26

先看第一种最简单的情形,所有类中没有任何虚函数的菱形继承。

下面是c++源码:

class Top {//虚基类
public:
int i;
Top(int ii) {
i = ii;
}
}; class Left : public virtual Top {
public:
int j;
Left(int jj, int ii) : Top(ii) {
j = jj;
}
}; class Right : public virtual Top {
public:
int k;
Right(int kk, int ii) : Top(ii) {
k = kk;
}
}; class Bottom : public Left, public Right {
public:
int l;
Bottom(int ll, int jj, int kk, int ii) : Top(ii), Left(jj, ii), Right(kk, ii) {
l = ll;
}
}; int main() {
Bottom b(, , , );
Bottom* bp = &b;
//访问自身成员变量
b.l = ;
bp->l = ;
//访问父类Left的成员变量
Left* lp = bp;
b.j = ;
bp->j = ;
lp->j = ;
//访问父类Right的成员变量
Right* rp = bp;
b.k = ;
bp->k = ;
rp->k = ;
//访问虚基类Top的成员变量
Top* tp = bp;
b.i = ;
bp->i = ;
tp->i = ; };

让我们来看看,汇编代码里面是怎样的情形,先看main函数里面的汇编码:

; 33   : int main() {

    push    ebp
mov ebp, esp
sub esp, ; 为对象程序所需变量预留空间,其中对象b只栈24byte ; 34 : Bottom b(1, 2, 3, 4); push ;压入标志1,作为判断是否调用虚基类构造函数的依据 1表示调用,0表示不调用
push ;压栈4,为对象b的构造函数传递参数
push ;压栈3,为对象b的构造函数传递参数
push ;压栈2,为对象b的构造函数传递参数
push ;压栈1,为对象b的构造函数传递参数
lea ecx, DWORD PTR _b$[ebp];获取对象b的首地址,传给寄存器ecx,作为隐含参数传递给对象b的构造函数
call ??0Bottom@@QAE@HHHH@Z ; 调用对象b的构造函数 ; 35 : Bottom* bp = &b; lea eax, DWORD PTR _b$[ebp];将对象b的首地址给寄存器eax
mov DWORD PTR _bp$[ebp], eax;将对象b的首地址给指针变量bp ; 36 :
; 37 : b.l = 1; mov DWORD PTR _b$[ebp+], ;将1写入偏移对象首地址16字节处内存,即为对象b的成员变量l赋值1 ; 38 : bp->l = 2; mov ecx, DWORD PTR _bp$[ebp];将对象b的首地址给寄存器ecx
mov DWORD PTR [ecx+], ;将2写入偏移对象首地址16字节处内存,即为对象b的成员变量l赋值2
;可以看到,无论是用对象本身,还是对象指针访问对象b的成员变量
;其成员变量的偏移量都在编译期固定了,为16字节
;且两种方式访问没有差别 ; 39 :
; 40 : Left* lp = bp; mov edx, DWORD PTR _bp$[ebp];将对象b的首地址给寄存器edx
mov DWORD PTR _lp$[ebp], edx;将对象b的首地址给对象指针lp,此时lp指向父对象Left的首地址
;从下面的内存布局图可以看到,父对象Left的首地址和Bottom一样 ; 41 : b.j = 1; mov DWORD PTR _b$[ebp+], ;将1赋给偏移对象b首地址4byte处内存,即为
;继承来的成员变量j赋值1 ; 42 : bp->j = 2; mov eax, DWORD PTR _bp$[ebp];将对象b的首地址给寄存器eax
mov DWORD PTR [eax+], ;将2写入偏移对象b首地址4byte处内存,即为继承来的成员变量j赋值2
;可以看到,无论使用b对象本身,还是指针访问继承来的成员变量j,
;其成员变量的偏移量都是编译器固定了,都为4byte
;且两种方式访问无差别 ; 43 : lp->j = 3; mov ecx, DWORD PTR _lp$[ebp];将父类Left对象的首地址给寄存器ecx
mov DWORD PTR [ecx+], ;将3赋给偏移Left对象首地址4byte处内存,即为父对象Left的成员变量j赋值3
;可以看到,用这种方式访问父对象Left的成员变量,其偏移量也是编译器固定
;为4byte ; 44 :
; 45 : Right* rp = bp; cmp DWORD PTR _bp$[ebp], ;比较指针的值是否为0,也就是判断bp是否为空指针
je SHORT $LN3@main;如果bp为空指针,则跳转到标号$LN3@main处执行,否则顺序执行,这里是顺序执行
mov edx, DWORD PTR _bp$[ebp];将对象b的首地址给寄存器edx
add edx, ;寄存器edx里面的内容加8,现在edx里面保存的地址偏移了对象b的首地址8byte,即指向了对象Right的首地址
mov DWORD PTR tv90[ebp], edx;将寄存器edx内容存入临时变量tv90
jmp SHORT $LN4@main;跳转到标号$LN4@main处执行
$LN3@main:
mov DWORD PTR tv90[ebp], ;将临时变量tv90赋值为空指针,这是在上面判断bp指针为空的情况下执行,这里不执行这一句
$LN4@main:
mov eax, DWORD PTR tv90[ebp];将临时变量tv90里面的值赋给寄存器eax,eax保存了对象Right的首地址
mov DWORD PTR _rp$[ebp], eax;将寄存器eax里面的值赋给指针rp
;到这里,完成了从指针bp到指针rp的转化,这里之所以有对bp指针为空的判断
;是因为,rp里面的地址值是由bp里面的地址值加8byte得来,如果不进行判断,一旦bp为空指针
;即bp不指向任何对象,那么rp将指向错误的内存,这种转换就有危险,编译器必须避免这种情况 ; 46 : b.k = 1; mov DWORD PTR _b$[ebp+], ;将1写入偏移对象b首地址12byte处,即将1赋给继承来的成员变量k ; 47 : bp->k = 2; mov ecx, DWORD PTR _bp$[ebp];将对象b首地址给寄存器ecx
mov DWORD PTR [ecx+], ;将2写入偏移对象b首地址12byte处,即将2赋给继承来的成员变量k
;可以看到,这里其成员变量的偏移量也是编译器固定,为2byte
;且两种方式访问没有差别 ; 48 : rp->k = 3; mov edx, DWORD PTR _rp$[ebp];将父对象Right首地址给寄存器edx
mov DWORD PTR [edx+], ;将3写给偏移父对象Right首地址4byte处,即将3赋给成员变量k ; 49 :
; 50 : Top* tp = bp; cmp DWORD PTR _bp$[ebp], ;比较bp指针的值是否为0,也就是判断bp是否为空,原因同上
jne SHORT $LN5@main;如果不为空,就跳转到标号处$LN5@main执行,否则顺序执行,这里跳转到标号处执行
mov DWORD PTR tv145[ebp], ;如果bp为空指针,就将0赋给临时变量tv145,这里不执行这一句
jmp SHORT $LN6@main;跳转到标号处$LN6@main执行
$LN5@main:
mov eax, DWORD PTR _bp$[ebp];将对象b的首地址给寄存器eax
mov ecx, DWORD PTR [eax];将对象b首地址里面的内容给寄存器ecx,对象b首地址处的值是vtable的地址,关于vtable将在下面解释
mov edx, DWORD PTR _bp$[ebp];将对象b的首地址给寄存器edx
add edx, DWORD PTR [ecx+];ecx里面存有vtable的首地址,这里取偏移vtable首地址4byte处内存内容(即对象b,或者父对象Left首地址到虚基类首地址的偏移量), 然后加上对象b的首地址
;得到虚基类对象Top的首地址
mov DWORD PTR tv145[ebp], edx;寄存器edx里面保存虚基类对象Top的首地址,保存到临时变量tv145里面
$LN6@main:
mov eax, DWORD PTR tv145[ebp];将临时变量tv145里面的值给寄存器eax
mov DWORD PTR _tp$[ebp], eax;寄存器eax里面含有虚基类对象Top首地址,给指针tp
;这里完成了从指针bp到tp的转换 ; 51 : b.i = 1; mov ecx, DWORD PTR _b$[ebp];将对象b的首地址的内容给寄存器ecx,ecx里面是vtable的首地址
mov edx, DWORD PTR [ecx+];取偏移vtable首地址4byte处的内容,即对象b首地址到虚基类Top首地址偏移量给寄存器edx
mov DWORD PTR _b$[ebp+edx], ;将对象首地址加上edx里面的偏移量,得到虚基类Top首地址,将1写入这给地址所指内存,ji
;为继承自虚基类的成员变量i赋值 ; 52 : bp->i = 2; mov eax, DWORD PTR _bp$[ebp];将对象b的首地址给寄存器eax
mov ecx, DWORD PTR [eax];将对象b首地址处内容给寄存器ecx,即将vtable的首地址给寄存器ecx
mov edx, DWORD PTR [ecx+];将偏移vtable首地址4byte处内存内容给寄存器edx,即将对象b首地址到虚基类Top首地址偏移量给edx
mov eax, DWORD PTR _bp$[ebp];将对象b首地址给寄存器eax
mov DWORD PTR [eax+edx], ;将对象b首地址加上刚才取出的偏移量,得到虚基类Top的首地址,将2写入改地址所处内存处,
;即为继承自虚基类的成员变量i赋值2 ; 53 : tp->i = 3; mov ecx, DWORD PTR _tp$[ebp];将虚基类对象Top的首地址给寄存器ecx
mov DWORD PTR [ecx], ;将3赋给虚基类对象Top首地址处内才能,即为成员变量i赋值 ; 54 :
; 55 : }; xor eax, eax
mov esp, ebp
pop ebp
ret
_main ENDP

接下来是Bottom构造函数的汇编码:

??0Bottom@@QAE@HHHH@Z PROC                ; Bottom::Bottom, COMDAT
; _this$ = ecx ; 28 : Bottom(int ll, int jj, int kk, int ii) : Top(ii), Left(jj, ii), Right(kk, ii) { push ebp
mov ebp, esp
push ecx;压栈ecx的目的是为保存对象b的首地址预留空间
mov DWORD PTR _this$[ebp], ecx;ecx里面保存这对象b的首地址,存放到刚才空间
cmp DWORD PTR _$initVBases$[ebp], ;_$initVBases所代表的内存里面的内容存放的是调用Bottom构造器时压入的标志,其值为1
;这里与0进行比较
je SHORT $LN1@Bottom;如果上面比较结果相等,就跳到标号处$LN1@Bottom执行,否则顺序执行,这里是顺序执行
mov eax, DWORD PTR _this$[ebp];将对象b的首地址给寄存器eax
mov DWORD PTR [eax], OFFSET ??_8Bottom@@7BLeft@@@;将Bottom-Left的vtable首地址写入对象b首地址处内存
mov ecx, DWORD PTR _this$[ebp];将对象b的首地址给寄存器ecx
mov DWORD PTR [ecx+], OFFSET ??_8Bottom@@7BRight@@@;将Bottom-Right的vtable首地址写入偏移对象b首地址8byte处
;即写入对象Right的首地址处内存
mov edx, DWORD PTR _ii$[ebp];将参数ii的值给寄存器edx
push edx;压栈寄存器edx,作为参数传递给虚基类的构造函数Top
mov ecx, DWORD PTR _this$[ebp];将对象b的首地址给寄存器ecx
add ecx, ; 将对象b的首地址加上20,得到虚基类Top的首地址,存放到寄存器ecx,作为隐含参数传递给虚基类Top的构造函数
call ??0Top@@QAE@H@Z ; 调用虚基类Top的构造函数
$LN1@Bottom:;
push ;标志0,说明已经调用过虚基类Top的构造函数,在调用Right和Left的构造函数时,就不会再调用了。
mov eax, DWORD PTR _ii$[ebp];将参数ii的值给寄存器eax
push eax;压栈eax,给Left的构造函数传递参数
mov ecx, DWORD PTR _jj$[ebp];将参数jj的值给寄存器ecx
push ecx;压栈ecx,给Left的构造函数传递参数
mov ecx, DWORD PTR _this$[ebp];将对象b的首地址(也就是对象Left的首地址)给寄存器ecx,作为隐含参数传递给Left构造函数
call ??0Left@@QAE@HH@Z ; 调用Left构造函数
push ;压栈标志0,说明已经调用过虚基类Top的构造函数,在调用Right和Left的构造函数时,就不会再调用了
mov edx, DWORD PTR _ii$[ebp];将参数ii的值给寄存器edx
push edx;压栈edx,给Right构造函数传递参数
mov eax, DWORD PTR _kk$[ebp];将参数kk的值给寄存器eax
push eax;压栈eax,给Right的构造函数传递参数
mov ecx, DWORD PTR _this$[ebp];将对象b的首地址给ecx
add ecx, ;将对象b的首地址加上8,得到对象Right的首地址,存入寄存器ecx,作为隐含参数传递给Right构造函数
call ??0Right@@QAE@HH@Z ; 调用Right构造函数 ; 29 : l = ll; mov ecx, DWORD PTR _this$[ebp];将对象b的首地址给寄存器ecx
mov edx, DWORD PTR _ll$[ebp];将参数ll的值给寄存器edx
mov DWORD PTR [ecx+], edx;将寄存器edx的内容写入偏移对象b首地址16byte处,即给对象b的成员变量l赋值 ; 30 : } mov eax, DWORD PTR _this$[ebp]
mov esp, ebp
pop ebp
ret ; 00000014H
??0Bottom@@QAE@HHHH@Z ENDP

下面是Left构造函数的汇编码:

??0Left@@QAE@HH@Z PROC                    ; Left::Left, COMDAT
; _this$ = ecx ; 12 : Left(int jj, int ii) : Top(ii) { push ebp
mov ebp, esp
push ecx;压栈ecx寄存器,是为保存对象Left的首地址预留空间
mov DWORD PTR _this$[ebp], ecx;寄存器ecx里面含有对象Left的首地址,存入刚才预留空间
cmp DWORD PTR _$initVBases$[ebp], ;_$initVBases所代表的内存,里面含有调用Left构造函数传入的标志,其值为0
;这里是将它的值和0作比较
je SHORT $LN1@Left;如果上面比较相等,则跳转到标号$LN1@Left处执行,否则顺序执行,这里跳转到标号执行,因此不会调用
;虚基类Top的构造函数,避免重复调用
;标号之前的语句在构造对象b的时候都不会执行
mov eax, DWORD PTR _this$[ebp];将Left对象的首地址给eax寄存器
mov DWORD PTR [eax], OFFSET ??_8Left@@7B@;将??_8Left@@7B@所带表的内存地址(即Left的vtable首地址)写入对象Left的首地址处内存
;由于这一句在构造对象b时不执行,设置无效
mov ecx, DWORD PTR _ii$[ebp];将参数ii的值给寄存器ecx
push ecx;将ecx压栈,给虚基类Top构造函数传递参数,但是这一句在构造对象b时不执行,因此传参无效
mov ecx, DWORD PTR _this$[ebp];将对象Left的首地址给ecx寄存器
add ecx, ;将Left的首地址加上8,得到Top对象的首地址,作为隐含参数传递给Top的构造函数
call ??0Top@@QAE@H@Z ; 调用Top的构造函数,但是在构造对象b时,这句不执行,因此调用无效
$LN1@Left: ; 13 : j = jj; mov edx, DWORD PTR _this$[ebp];将对象Left的首地址给寄存器edx
mov eax, DWORD PTR _jj$[ebp];将参数jj给寄存器eax
mov DWORD PTR [edx+], eax;将eax寄存器里面的内容写入偏移对象Left首地址4byte处内存,即给成员变量j赋值jj ; 14 : } mov eax, DWORD PTR _this$[ebp]
mov esp, ebp
pop ebp
ret ; 0000000cH
??0Left@@QAE@HH@Z ENDP

下面是Right构造函数的汇编码:

??0Right@@QAE@HH@Z PROC                    ; Right::Right, COMDAT
; _this$ = ecx ; 20 : Right(int kk, int ii) : Top(ii) { push ebp
mov ebp, esp
push ecx;压栈ecx的目的是为了保存对象Right的首地址预留空间
mov DWORD PTR _this$[ebp], ecx;ecx寄存器保存有对象Right的首地址,存放到刚才预留空间
cmp DWORD PTR _$initVBases$[ebp], ;_$initVBases所代表的内存存放调用Right构造函数时传入的标志,其值为0,说明
;这里将其值与0比较
je SHORT $LN1@Right;如果比较相等,就跳转到标号处执行$LN1@Right,不会调用虚基类的构造函数,否则,顺序执行,这里跳转到标号执行
;所有标号之前的语句在构造对象b时都不会执行
mov eax, DWORD PTR _this$[ebp];将对象Right的首地址给寄存器eax
mov DWORD PTR [eax], OFFSET ??_8Right@@7B@;将??_8Right@@7B@的所带表的内存地址(即Right的vtable首地址)写入到对象Right的首地址处内存
mov ecx, DWORD PTR _ii$[ebp];将参数ii的值给寄存器ecx
push ecx;压栈ecx,为调用Top构造函数传递参数
mov ecx, DWORD PTR _this$[ebp];将对象Right首地址给寄存器ecx
add ecx, ;将对象Right的首地址加8,得到对象Top首地址,作为隐含参数传递给Top的构造函数
call ??0Top@@QAE@H@Z ; 调用Top构造函数
$LN1@Right: ; 21 : k = kk; mov edx, DWORD PTR _this$[ebp];将Right首地址给寄存器edx
mov eax, DWORD PTR _kk$[ebp];将参数kk的值给寄存器eax
mov DWORD PTR [edx+], eax;将eax里面的值写入偏移对象Right首地址4byte处,即为成员变量k赋值kk ; 22 : } mov eax, DWORD PTR _this$[ebp]
mov esp, ebp
pop ebp
ret ; 0000000cH
??0Right@@QAE@HH@Z ENDP

下面是Top函数的汇编码:

??0Top@@QAE@H@Z PROC                    ; Top::Top, COMDAT
; _this$ = ecx ; 4 : Top(int ii) { push ebp
mov ebp, esp
push ecx;压栈的目的是为保留对象Top的首地址预留空间
mov DWORD PTR _this$[ebp], ecx;ecx寄存器里面含有对象Top的首地址,存到刚才预留的空间 ; 5 : i = ii; mov eax, DWORD PTR _this$[ebp];将对象Top的首地址给寄存器eax
mov ecx, DWORD PTR _ii$[ebp];将参数ii的值给寄存器ecx
mov DWORD PTR [eax], ecx;将ecx的值写入对象Top首地址处,即给成员变量i赋值ii ; 6 : } mov eax, DWORD PTR _this$[ebp]
mov esp, ebp
pop ebp
ret
??0Top@@QAE@H@Z ENDP

下面是类之间的继承关系图:

从汇编看c++的虚拟继承以及其内存布局(一)

图1 菱形继承,所有类不含任何虚函数

下面是每个类的内存布局

从汇编看c++的虚拟继承以及其内存布局(一)

从汇编看c++的虚拟继承以及其内存布局(一)

Left(12byte)

从汇编看c++的虚拟继承以及其内存布局(一)

Right(12byte)

从汇编看c++的虚拟继承以及其内存布局(一)

Bottom(24byte)

上面代码中,Left和Right类对象首地址处都含有一个vbtable(误写为了vtable)指针,指向一个vbtable,vbtable里面只有两项:第一项是vbtable指针所属类的虚表指针vptr(没有就从对象首地址开始算)相对于vbtale指针的偏移量;第二项是其父类虚表指针vptr(没有的话就是对象首地址)相对于vbtable的偏移量。

从Bottom Left Right的构造函数可以看出来,在每次调用相应的构造函数之前,都会有编译器传入一个标志,以此来防止虚基类构造函数被多次调用。这就是为什么虚基类只有一份实例的原因。虚基类的构造函数总是由当前正构造的对象的构造函数调用,比如这里构造Bottom对象时,就由Bottom构造函数调用,Left和Right构造函数不会调用。