浅谈C++中虚函数实现原理揭秘

时间:2022-09-14 21:16:55

编译器到底做了什么实现的虚函数的晚绑定呢?我们来探个究竟。     

编译器对每个包含虚函数的类创建一个表(称为V TA B L E)。在V TA B L E中,编译器放置特定类的虚函数地址。在每个带有虚函数的类 中,编译器秘密地置一指针,称为v p o i n t e r(缩写为V P T R),指向这个对象的V TA B L E。通过基类指针做虚函数调 用时(也就是做多态调用时),编译器静态地插入取得这个V P T R,并在V TA B L E表中查找函数地址的代码,这样就能调用正确的函数使晚捆绑发生。为每个类设置V TA B L E、初始化V P T R、为虚函数调用插入代码,所有这些都是自动发生的,所以我们不必担心这些。利用虚函数, 这个对象的合适的函数就能被调用,哪怕在编译器还不知道这个对象的特定类型的情况下。(《C++编程思想》)

在任何类中不存在显示的类型信息,可对象中必须存放类信息,否则类型不可能在运行时建立。那这个类信息是什么呢?

我们来看下面几个类:

class no_virtual

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
{
public:
  void fun1() const{}
  int fun2() const { return a; }
private:
  int a;
} class one_virtual
{
public:
  virtual void fun1() const{}
  int fun2() const { return a; }
private:
  int a;
} class two_virtual
{
public:
  virtual void fun1() const{}
  virtual int fun2() const { return a; }
private:
  int a;
}

以上三个类中:

no_virtual没有虚函数,sizeof(no_virtual)=4,

类no_virtual的长度就是其成员变量整型a的长度;

one_virtual有一个虚函数,sizeof(one_virtual)=8;

two_virtual 有两个虚函数,sizeof(two_virtual)=8;

有一个虚函数和两个虚函数的类的长度没有区别,其实它们的长度就是no_virtual的 长度加一个void指针的长度,它反映出,如果有一个或多个虚函数,编译器在这个结构中插入一个指针( V P T R)。在one_virtual 和 two_virtual之间没有区别。这是因为V P T R指向一个存放地址的表,只需要一个指针,因为所有虚函数地址都包含在这个表中。 这个VPTR就可以看作类的类型信息。

那我们来看看编译器是怎么建立VPTR指向的这个虚函数表的。先看下面两个类:

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
class base
{
public:
  void bfun(){}
  virtual void vfun1(){}
  virtual int vfun2(){}
private:
  int a;
} class derived : public base
{
public:
  void dfun(){}
  virtual void vfun1(){}
  virtual int vfun3(){}
private:
  int b;
}

两个类VPTR指向的虚函数表(VTABLE)分别如下:

base类

 

?
1
2
3
4
5
      ——————
VPTR——> |&base::vfun1 |
      ——————
     |&base::vfun2 |
     ——————

derived类

?
1
2
3
4
5
6
7
      ———————
VPTR——> |&derived::vfun1 |
      ———————
     |&base::vfun2 |
     ———————
     |&derived::vfun3 |
     ———————

每当创建一个包含有虚函数的类或从包含有虚函数的类派生一个类时,编译器就为这个类创建一个VTABLE,如上图所示。在这个表中,编译器放置了在这个类 中或在它的基类中所有已声明为virtual的函数的地址。如果在这个派生类中没有对在基类中声明为virtual的函数进行重新定义,编译器就使用基类 的这个虚函数地址。(在derived的VTABLE中,vfun2的入口就是这种情况。)然后编译器在这个类中放置VPTR。当使用简单继承时,对于每 个对象只有一个VPTR。VPTR必须被初始化为指向相应的VTABLE,这在构造函数中发生。

一旦VPTR被初始化为指向相应的VTABLE,对象就"知道"它自己是什么类型。但只有当虚函数被调用时这种自我认知才有用。       

个人总结如下:

1、从包含虚函数的类派生一个类时,编译器就为该类创建一个VTABLE。其每一个表项是该类的虚函数地址。

2、在定义该派生类对象时,先调用其基类的构造函数,然后再初始化VPTR,最后再调用派生类的构造函数( 从二进制的视野来看,所谓基类子类是一个大结构体,其中this指针开头的四个字节存放虚函数表头指针。执行子类的构造函数的时候,首先调用基类构造函数,this指针作为参数,在基类构造函数中填入基类的vptr,然后回到子类的构造函数,填入子类的vptr,覆盖基类填入的vptr。如此以来完成vptr的初始化。 )

3、在实现动态绑定时,不能直接采用类对象,而一定要采用指针或者引用。因为采用类对象传值方式,有临时基类对象的产生,而采用指针,则是通过指针来访问外部的派生类对象的VPTR来达到访问派生类虚函数的结果。       

VPTR 常常位于对象的开头,编译器能很容易地取到VPTR的值,从而确定VTABLE的位置。VPTR总指向VTABLE的开始地址,所有基类和它的子类的虚函 数地址(子类自己定义的虚函数除外)在VTABLE中存储的位置总是相同的,如上面base类和derived类的VTABLE中vfun1和vfun2 的地址总是按相同的顺序存储。编译器知道vfun1位于VPTR处,vfun2位于VPTR+1处,因此在用基类指针调用虚函数时,编译器首先获取指针指 向对象的类型信息(VPTR),然后就去调用虚函数。如一个base类指针pBase指向了一个derived对象,那pBase->vfun2 ()被编译器翻译为 VPTR+1 的调用,因为虚函数vfun2的地址在VTABLE中位于索引为1的位置上。同理,pBase->vfun3 ()被编译器翻译为 VPTR+2的调用。这就是所谓的晚绑定。

以上这篇浅谈C++中虚函数实现原理揭秘就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持服务器之家。