关于C++,最常听到的一个抱怨就是:编译器背着程序员干了太多的事情。
default constructor函数的构建
default constructors会在需要的时候被编译器创建出来,关键字是:在需要的时候?被谁需要?用来做什么事情?
例如:
class Foo{ public: int first_val; int second_val; }; void foo_bar() {
Foo foo; //foo对象中的成员变量应在此处被初始化
if (foo.first_val)
//...do samething
}
在这个例子中,正确的程序语义是要求Foo有个default constructors,可以将它的两个members初始化为0。这段代码可曾符合"在需要的时候"?答案是NO
其间的差别在于一个是程序需要,一个是编译器需要。如果是程序需要,那初始化的任务是程序员的责任,只有当编辑器需要时default constructors才会被合成。
此外,被合成出来的default constructors只执行编译器所需的行动,也就是说,即使有需要为class Foo合成一个default constructors,那个合成出来的constructors也不会将数据成员初始化为0,为了让上一段代码正确执行,类的设计者必须提供一个明显的constructors将两个成员变量初始化。
C++ Standard[ISO-C++95]的Section2.1上讲:被编译器合成的default constructors将是一个浅薄而无能,没啥用的constructors。
下面分别讨论nontrival(非平凡) default constructors的四种情况
情况1:带有default constructors的成员类对象
如果一个class没有任何constructors,但它内含一个类成员对象,而后者有default constructors(如果只有带参构造函数,编译器会认为你用心设计这个类,会将初始化任务交给设计者),那么这个类的合成的default constructors就是nontrivial,不过这个合成操作只有在constructors真正需要被调用的时候才会发生。
例如:
class Foo { public: Foo() { std::cout << "l am called" << std::endl; } Foo(int){} };
class Bar { public: Foo foo; char *str; }; int main() {
Bar foo; //Bar::foo对象必须在此处被初始化
if (foo.str) { /*........*/}
}
被合成的Bar default constructor内含必要的代码,能够调用class Foo的default constructor来处理member object Bar::foo,但并不产生任何代码来处理Bar::str。即被合成的default constructor只是为了满足编译器的需要(编译器需要有个地方来初始化Bar::Foo,因为它有自己的default constructor),而不是程序的需要(初始化Bar::str是程序员的任务)。再一次提醒:被合成的default constructors只满足编译器的需要,而不是程序的需要。
如果我们在Bar类中添加构造函数:
Bar::Bar() { str = ; }
现在程序的需求满足了,但是编译器还需要初始化成员对象foo,由于default constructor已经被明确定义出来,编译器没办法合成第二个。则编译器会扩张已存在的constructor,在其中安插一些代码,使得user code在被执行之前,先调用必要的default constructor 。
已被显示声明的constructor会被编译器扩展为:
Bar::Bar(){
foo.Foo::Foo(); //编译器安插的隐藏代码代码
str = ; //显式的程序员代码
}
一个类中如果有多个类成员对象都要求constructor初始化操作,C++将以成员对象在类中的声明次序来调用各个constructor,这一点有编译器完成。
情况2:带有default constructor的Base Class
如果一个没有任何constructor的类派生自一个带有default constructor的基类,那么这个子类的default constructor会被视为nontrivial,因此需要被合成出来调用基类的default constructor(根据它们的声明次序)。
如果设计者提供多个constructor,编译器不会合成新的default constructor,而是会扩展现有的每一个constructor,将用来调用所需要的default constructor的程序代码加进去。
情况3:这个类带有Virtual Function
这种情况包括两个更细的情况:
1.这个类自己声明(或者继承)一个Virtual Function。
2.这个类继承自一个继承串链,其中有virtual base class。
这种情况下,编译时,要做如下工作:
1.一个virtual function table(vtbl)会被编译器生成出来,内存放类的virtual functons地址。
2.在每一个class object中,一个额外的pointer member(就是vptr,指向vtbl)会被编译器合成出来。此外虚拟调用会被替换(w.vf() => w.vprt[1])。
为了支持这种功能,编译器必须为每个w对象设置它的vptr(这是成员变量,此时需要指向合适的vtbl),因此编译器需要在default constructor中安插一些代码来完成这种工作。
情况4:这个类带有Virtual Base Class。
考虑这样的代码:
classX { public: inti; };
classA : publicvirtualX { public: intj; };
classB : publicvirtualX { public: doubled; };
classC : publicA, publicB { public: intk; };
//无法在编译期间解析出 pa->i 的位置(给一个pa无法确定i的地址)。
void foo( constA* pa ) { pa->i = 1024; }
main() {
foo( new A );
foo( new C );
// ...
}
由于pa的真正类型不确定,所以某些编译器会记录一个指针例(如 __vbcX)来记录X,然后通过这个指针来定位pa指向的i。上述
void foo( constA* pa ) { pa->i = 1024; }
变成了:
void foo( constA* pa ) { pa-> __vbcX ->i = 1024; }
因此,__vbcX这个指针需要在object构造期间设置好。于是编译器需要一个default constructor来完成这个工作。
复制构造函数Copy constructor的构造
何时用到copy constructor:显式用t1初始化t2;传参;返回一个类对象。
如果程序员显式定义了copy constructor,则调用它。
如果没有,其内部是通过 default memberwise initialization的手法完成的(将源对象的所有member复制给目的对象,对于member class object,会递归执行memberwise initialization)。
这些操作是如何构造的:
概念上讲,这些操作是被一个copy constructor实现的。
上述强调“概念上讲”,是因为有时候copy constructor是trivial的。
copy constructor何时是nontrivial:简单的答案为当class没有展现bitwise copy semantics时,copy constructor是nontrivial的。
那么什么时候class没有展现bitwise copy semantics:答案为有四种情况。
情况1:这个类的某个member object有copy constructor。(编译器要在这个类的copy constructor来调用其member object的copy constructor)。
情况2:这个类继承自某个有copy constructor的base class。(编译器要在这个类的copy constructor来调用其base class的copy constructor)。
情况3:这个类声明了若干个virtual function。
如下代码
void draw(const ZooAnimal& zoey) {zoey.draw();}
void foo() {
ZooAnimal franny = yogi;
draw (yogi); //调用 Bear::draw()
draw (franny); //调用 ZooAnimal::draw()
}
如果ZooAnimal按照bitwise copy进行复制(ZooAnimal franny = yogi;),则会出现franny的vptr设置成了yogi的vptr,于是draw (franny);调用的会是Bear的draw。(事实上不是,因为franny是一个实例,不是指针也不是引用)。
因此ZooAnimal的复制构造函数需要显式设定vptr(使之指向ZooAnimal的vtbl),这个设置动作需要在合成的copy constructor中完成。
情况4:这个类派生自的继承链中有virtual base class。
同构造函数的情况4。 __vbcXXX需要显式重设,这个设置动作需要在合成的copy constructor中完成。
Raccoon和RedPanda中含有指向virtual base class subobject的指针(设为__vbcZooAnml),则当用RedPanda初始化Raccoon时( Raccoon rc=rp;),将Raccoon-> __vbcZooAnml 设置为RedPanda->__vbcZooAnml是不对的。因此需要重新设置__vbcZooAnml,这个动作需要在copy constructor中完成。
总结以上4种情况,bitwise copy semantics的意思可以理解为:类的某些成员变量(包括程序员定义的成员变量和编译器所需要的变量如vptr、__vbc等)不能按位复制时,需要调用成员变量的copy constructor或者重设vptr等编译器所需类的成员变量,这些动作都需要在发生对象复制的时候完成,因此编译器会合成一个copy constructor(入股没有的话)。
程序转化语义学 Program Transformation Semantics
显式的初始化操作 Explicit Initialization
X x0;
void foo_bar(){
X x1(x0); //定义了x1
X x2 = x0; //定义了x2
X x3 = X(x0); //定义了x3
}
转化的两个动作:重写每一个定义,其初始化部分被剥除;用copy constructor初始化。
即变成了
void foo_bar(){
X x1; //定义被重写,初始化操作被剥除
X x2; //定义被重写,初始化操作被剥除
X x3; //定义被重写,初始化操作被剥除
//编译器安插X copy constructor。
x1.X::X( x0 );
x2.X::X( x0 );
x3.X::X( x0 );
}
其中x1.X::X( x0 );会表现为对copy constructor(即 X::X( constX& xx);)的调用。
参数初始化 Argument Initialization
如下代码的变化
void foo(X x0);
...
X xx;
foo(xx)
变成了
void foo(X& x0);
...
X __tmp;
__tmp.X::X( XX );
foo(__tmp);
其中X声明了destruconstructor,它在foo调用完成后销毁__tmp。
另一种变化是拷贝构建(copy construct),将实际参数直接建在其应该在的位置上。
返回值的初始化 Return Value Initialization
X bar(){
X xx;
...
return xx;
}
变成了
void bar(X& _result){
X xx;
...
_result.X::X(xx);
return;
}
对函数的调用
X xx=bar();
变为:
X xx;
bar(xx);
对函数的调用
bar().memfunc();
变为:
X _tmp;
(bar(_tmp),_tmp).memfunc();
在使用者层面做优化 Optimization at the User Level
在编译器层面做优化 Optimization at the Compiler Level
针对这种转化:
X bar(){
X xx;
...
return xx;
}
变成
void bar(X& _result){
X xx;
...
_result.X::X(xx);
return;
}
这一转换的一个优化为:转变成如下代码
void bar(X& _result){
_result.X::X(xx);
//原来处理xx,现在变为处理_result。
return;
}
这一优化称之为NRV(Named Return Value)。
虽如此,NRV饱受批评。主因有二:编译器实现程度不一致(有些编译器)。函数变得复杂时,优化难以实施。
Foo() { std::cout << "l am called" << std::endl; }
,