基于c++中的默认拷贝函数的使用详解

时间:2022-06-28 15:38:46

《c++编程思想》上说一个类如果没有拷贝函数,那么编译器就会自动创建一个默认的拷贝函数。下面就让我们看一下真实的情况。

首先看一个简单的类X,这个类没有显示定义拷贝构造函数。

c++源码如下:

复制代码 代码如下:


class X {
private:
    int i;
    int j;
};

 

int main() {
    X x1;//先定义对象x1
    X x2 = x1;//将x1拷贝给x2
}


下面是其汇编代码:

复制代码 代码如下:


_main    PROC

 

; 7    : int main() {

    push    ebp
    mov    ebp, esp
    sub    esp, 16                    ; 为对象x1,x2预留16byte的栈空间

; 8    :     X x1;//先定义对象x1
; 9    :     X x2 = x1;//将x1拷贝给x2

    mov    eax, DWORD PTR _x1$[ebp];将x1的首地址里面的内容给寄存器eax,也就将x1中的成员变量i的值给eax
    mov    DWORD PTR _x2$[ebp], eax;将eax里面的值写入x2的首地址,也就是将eax里面的值写给x2的成员变量i
    mov    ecx, DWORD PTR _x1$[ebp+4];将偏移x1首地址4byte的内存里面的值给寄存器eax,也就是将x1中的成员变量j的值给ecx
    mov    DWORD PTR _x2$[ebp+4], ecx;将ecx里面的值写入偏移x2首地址4byte的内存里面,也就是将ecx里面的值写给x2的成员变量j

; 10   : }

    xor    eax, eax
    mov    esp, ebp
    pop    ebp
    ret    0
_main    ENDP


从汇编代码里面可以看出,根本没有函数被调用,所有的拷贝赋值都是通过寄存器与内存地址相互通信完成。和编译器提供默认构造函数一样,可以把这种情况看成是编译器提供了一个无用的拷贝构造函数。

 

那么,什么时候编译器才真正的提供默认拷贝构造函数,并且显示调用呢?

下面是一种情况,类X里面含有虚成员函数:

c++源码:

复制代码 代码如下:


class X {
private:
    int i;
    int j;
public:
    virtual ~X() {}//虚析构函数
};

 

int main() {
    X x1;//先定义对象x1
    X x2 = x1;//将x1拷贝给x2
}


由于这里只讨论拷贝函数,所以只看主函数main和拷贝函数里面的汇编代码:

 

下面是主函数main里面的汇编代码:

复制代码 代码如下:


_main    PROC

 

; 9    : int main() {

    push    ebp
    mov    ebp, esp
    sub    esp, 24                    ; 由于引入了虚函数,每个类所占的空间编程12byte 成员变量i,j8byte vptr指针4byte 因此这里为x1 x2预留24byte

; 10   :     X x1;//先定义对象x1

    lea    ecx, DWORD PTR _x1$[ebp];获取x1的首地址,放入ecx,为调用构造函数的秘密参数传入,即this
    call    ??0X@@QAE@XZ;调用构造函数

; 11   :     X x2 = x1;//将x1拷贝给x2

    lea    eax, DWORD PTR _x1$[ebp];获取x1的首地址,放入寄存器eax
    push    eax;将eax压栈,作为拷贝构造函数的参数
    lea    ecx, DWORD PTR _x2$[ebp];获取x2的首地址,放入寄存器ecx,作为调用拷贝构造函数的秘密参数传入,即this
    call    ??0X@@QAE@ABV0@@Z;调用拷贝构造函数

; 12   : }

    lea    ecx, DWORD PTR _x2$[ebp];获取x2的首地址,放入ecx寄存器,作为调用析构函数传入的秘密参数,即this
    call    ??1X@@UAE@XZ                ; 调用析构函数
    lea    ecx, DWORD PTR _x1$[ebp];获取x1的首地址,放入ecx寄存器,作为调用析构函数传入的秘密参数,即this
                                ;析构的顺序与构建的顺序相反
    call    ??1X@@UAE@XZ                ; 调用析构函数
    xor    eax, eax
    mov    esp, ebp
    pop    ebp
    ret    0
_main    ENDP


可以看到,编译器为类X提供了默认的拷贝构造函数(非无用的默认拷贝构造函数),并且显示调用。

 

由于一个类继承自虚基类或者继承自有虚函数成员的基类,使得它本身也含有虚函数成员,因此也就属于上一种情形。所以编译器在这种情况下,也会提供非无用的默认拷贝构造函数,并且能够显示调用。

下面是第二种情形,类X继承自类Y,类Y有显示定义的拷贝构造函数,而类没有提供拷贝构造函数:

下面是c++源码:

复制代码 代码如下:


class Y {
private:
    int j;
public:
   Y(const Y& y) {}
   Y() {};//必须为Y提供默认的构造函数,否则编译出错
};
class X : public Y {
private:
    int i;
    int j;
};

 


int main() {
    X x1;//先定义对象x1
    X x2 = x1;//将x1拷贝给x2
}


下面是mian函数汇编代码:

复制代码 代码如下:


; 16   : int main() {

 

    push    ebp
    mov    ebp, esp
    sub    esp, 24                    ; 为x1 x2预留24byte空间

; 17   :     X x1;//先定义对象x1

    lea    ecx, DWORD PTR _x1$[ebp];获取x1的首地址,作为隐含参数传递给构造函数
    call    ??0X@@QAE@XZ;//调用编译器为类X提供的默认构造函数

; 18   :     X x2 = x1;//将x1拷贝给x2

    lea    eax, DWORD PTR _x1$[ebp];获取x1的首地址,传给寄存器eax
    push    eax;将eax压栈,作为调用类X的拷贝构造函数的参数
    lea    ecx, DWORD PTR _x2$[ebp];获取x2的首地址,作为调用类X的拷贝函数的隐含参数
    call    ??0X@@QAE@ABV0@@Z;调用编译器提供的默认拷贝构造函数

; 19   : }

    xor    eax, eax
    mov    esp, ebp
    pop    ebp
    ret    0


下面是类X的拷贝构造函数的汇编码:

复制代码 代码如下:

??0X@@QAE@ABV0@@Z PROC                    ; X::X, COMDAT
; _this$ = ecx
    push    ebp
    mov    ebp, esp
    push    ecx
    mov    DWORD PTR _this$[ebp], ecx;ecx里面有x2的首地址
    mov    eax, DWORD PTR ___that$[ebp];将x1的首地址给eax
    push    eax;将eax的首地址压栈,作为调用父类拷贝构造函数的参数
    mov    ecx, DWORD PTR _this$[ebp];将x2的首地址给ecx,作为隐含参数传给父类的拷贝构造函数
    call    ??0Y@@QAE@ABV0@@Z            ; 调用父类拷贝构造函数
    mov    ecx, DWORD PTR _this$[ebp];获取x2的首地址给ecx
    mov    edx, DWORD PTR ___that$[ebp];获取x1的首地址给edx
    mov    eax, DWORD PTR [edx+4];将偏移x1首地址4byte处的内存里面的值写给eax,即将x1中子类成员变量i的值写给eax,因为x1的首地址处存放的是父类成员变量i,其值
                              ;由父类拷贝构造函数负责拷贝给x2
    mov    DWORD PTR [ecx+4], eax;将eax的值写入偏离x2首地址4byte处的内存里面,即将eax的值写入x2中子类成员变量i,因为x2的首地址处存放父类成员变量i,其值
                              ;由父类拷贝构造函数负责拷贝
    mov    ecx, DWORD PTR _this$[ebp];将x2的首地址给ecx
    mov    edx, DWORD PTR ___that$[ebp];将x1的首地址给edx
    mov    eax, DWORD PTR [edx+8];将偏移x1首地址8byte处的内存里面的值给eax,即将x1中子类成员变量j的值给eax
    mov    DWORD PTR [ecx+8], eax;将eax的值写入偏移x2首地址8byte的内存里面,即将eax的值写入x2子类成员j中
    mov    eax, DWORD PTR _this$[ebp];将x2的首地址给eax,作为返回值。构造函数总是返回对象首地址
    mov    esp, ebp
    pop    ebp
    ret    4
??0X@@QAE@ABV0@@Z ENDP


从汇编码中可以看到,编译器确实为类X提供了默认的拷贝构造函数,并且进行了显示调用。而且在调用类X的拷贝构造函数中,首先调用父类的拷贝构造函数,拷贝父类中的成员变量,然后再拷贝子类中的成员变量。

 

下面是父类Y中的拷贝构造函数汇编码:

复制代码 代码如下:


??0Y@@QAE@ABV0@@Z PROC                    ; Y::Y, COMDAT
; _this$ = ecx

 

; 5    :    Y(const Y& y) {}

    push    ebp
    mov    ebp, esp
    push    ecx;//这里压栈的目的是为隐含传给父类拷贝函数的this(即x2的首地址)
    mov    DWORD PTR _this$[ebp], ecx;ecx里面含有x2的首地址(即this),放入刚才的预留空间
    mov    eax, DWORD PTR _this$[ebp];将x2的首地址写入eax,作为返回值。构造函数总是返回对象首地址
    mov    esp, ebp
    pop    ebp
    ret    4
??0Y@@QAE@ABV0@@Z ENDP                    ; Y::Y
_TEXT    ENDS


从汇编吗可以看到,由于父类自己显示定义了拷贝构造函数,编译器只是负责调用而已,并不提供像上面子类X里面默认拷贝构造函数的拷贝功能,即并不拷贝父类成员变量i。因为,在c++源码里面,父类拷贝构造函数本身就是空函数,什么也不做。

 

如果子类X 父类Y都不提供拷贝构造函数,情形有时怎样的呢?

下面是c++源码:

复制代码 代码如下:


class Y {
private:
    int j;
};
class X : public Y {
private:
    int i;
    int j;
};

 


int main() {
    X x1;//先定义对象x1
    X x2 = x1;//将x1拷贝给x2
}


下面是对应的汇编码:

复制代码 代码如下:


_main    PROC

 

; 12   : int main() {

    push    ebp
    mov    ebp, esp
    sub    esp, 24                    ; 为x1 x2预留24byte空间

; 13   :     X x1;//先定义对象x1
; 14   :     X x2 = x1;//将x1拷贝给x2

    mov    eax, DWORD PTR _x1$[ebp];获取x1的首地址里面的值,存入eax,即获取x1父类成员变量i的值写给eax
    mov    DWORD PTR _x2$[ebp], eax;将eax的值写入x2的首地址指向的内存,即将eax的值写给x2中的父类成员变量i
    mov    ecx, DWORD PTR _x1$[ebp+4];获取偏移x1首地址4byte处的内存里面的值,写入ecx,即获取x1子类成员变量i的值写给ecx
    mov    DWORD PTR _x2$[ebp+4], ecx;将ecx的值写入偏移x2首地址4byte处的内存里面,即将ecx的值写给x2中子类成员变量i
    mov    edx, DWORD PTR _x1$[ebp+8];获取偏移x1首地址8byte处的内存里面的值,写入edx,即获取x1子类成员变量j的值写给edx
    mov    DWORD PTR _x2$[ebp+8], edx;将edx的值写入偏移x2首地址8byte处的内存里面,即将edx的值写入x2子类成员变量j

; 15   : }

    xor    eax, eax
    mov    esp, ebp
    pop    ebp
    ret    0
_main    ENDP


可以看到,编译器执行了拷贝过程,但是提供的是像刚开始的无用的默认拷贝构造函数,无论是拷贝父类成员变量,还是子类成员变量,都没有函数的调用。

 

下面看第三种情况,类X含有类Y的成员变量,类Y的成员变量有拷贝构造函数。

c++源码如下:

复制代码 代码如下:


class Y {
private:
    int j;
public:
    Y(const Y& y) {}
    Y() {}//必须为Y提供默认的构造函数,否则编译报错
};
class X  {
private:
    int i;
    int j;
    Y y;
};

 


int main() {
    X x1;//先定义对象x1
    X x2 = x1;//将x1拷贝给x2
}


下面是main函数中的汇编码:

复制代码 代码如下:


_main    PROC

 

; 16   : int main() {

    push    ebp
    mov    ebp, esp
    sub    esp, 24                    ; 为x1 x2预留24byte的空间

; 17   :     X x1;//先定义对象x1

    lea    ecx, DWORD PTR _x1$[ebp];获取x1的首地址,作为隐含参数传递给构造函数
    call    ??0X@@QAE@XZ;调用构造函数

; 18   :     X x2 = x1;//将x1拷贝给x2

    lea    eax, DWORD PTR _x1$[ebp];获取x1的首地址,放入寄存器eax
    push    eax;将eax压栈,为作为参数传递给编译器提供的默认拷贝构造函数
    lea    ecx, DWORD PTR _x2$[ebp];获取x2的首地址,作为隐含参数传递给编译器提供的默认拷贝构造函数
    call    ??0X@@QAE@ABV0@@Z;调用拷贝构造函数

; 19   : }

    xor    eax, eax
    mov    esp, ebp
    pop    ebp
    ret    0
_main    ENDP


下面是编译器为类X提供的默认拷贝构造函数的汇编码:

复制代码 代码如下:

??0X@@QAE@ABV0@@Z PROC                    ; X::X, COMDAT
; _this$ = ecx
    push    ebp
    mov    ebp, esp
    push    ecx;压栈的目的是为this(即x2的首地址)预留空间
    mov    DWORD PTR _this$[ebp], ecx;ecx里面含有x2的首地址,放入刚才预留的空间里面
    mov    eax, DWORD PTR _this$[ebp];将x2的首地址给eax
    mov    ecx, DWORD PTR ___that$[ebp];将x1的首地址给ecx
    mov    edx, DWORD PTR [ecx];将x1的首地址的内容写入edx,即将x1中的成员变量i写入edx
    mov    DWORD PTR [eax], edx;将edx的值写入x2的首地址,即将edx的值写入x2的成员变量i
    mov    eax, DWORD PTR _this$[ebp];将x2的首地址写入寄存器eax
    mov    ecx, DWORD PTR ___that$[ebp];将x1的首地址写入寄存器ecx
    mov    edx, DWORD PTR [ecx+4];将偏移x1首地址4byte处的内存里面的值写入edx,即将x1的成员变量j的值写入edx
    mov    DWORD PTR [eax+4], edx;将edx的值写入偏移x2首地址4byte处的内存,即将edx的值写入x2的成员变量j
    mov    eax, DWORD PTR ___that$[ebp];将x1的首地址存入寄存器eax
    add    eax, 8;//将x1的首地址加8,得到x1中成员对象y所处的地址,放入eax中
    push    eax;将eax的值压栈,作为调用成员变量y的拷贝函数的参数
    mov    ecx, DWORD PTR _this$[ebp];将x2的首地址存入寄存器ecx
    add    ecx, 8;将x2的首地址加8,得到x2中成员对象y所在地址,放入ecx,这个地址作为隐含的参数传给成员变量函数的拷贝构造函数
    call    ??0Y@@QAE@ABV0@@Z            ; 调用成员对象y的拷贝构造函数
    mov    eax, DWORD PTR _this$[ebp];将x2的首地址放入eax,作为返回值。构造函数总是返回对象的首地址
    mov    esp, ebp
    pop    ebp
    ret    4
??0X@@QAE@ABV0@@Z ENDP


从汇编吗可以看到,调用类X拷贝构造函数的时候,先将x1中的成员变量i,j拷贝到x2中,然后才是调用成员对象y的拷贝构造函数拷贝y中的成员变量。这和继承不同,在继承中,总是先调用父类的拷贝构造函数,再进行子类中的拷贝。这说明,对于这种包含成员对象的情况,成员对象的拷贝函数调用时机与他们定义的位置有关。在这里,类X的成员对象y在成员变量i,j之后定义,因此,它的拷贝构造函数要等拷贝完i,j之后才会被调用。

 

下面是类Y中的拷贝构造函数汇编代码:

复制代码 代码如下:


??0Y@@QAE@ABV0@@Z PROC                    ; Y::Y, COMDAT
; _this$ = ecx

 

; 6    :     Y(const Y& y) {}

    push    ebp
    mov    ebp, esp
    push    ecx;压栈ecx的目的是为了存放this(x2中成员对象y的首地址)预留空间
    mov    DWORD PTR _this$[ebp], ecx;ecx里面有x2中成员对象y的首地址,放入刚才的预留空间
    mov    eax, DWORD PTR _this$[ebp];将x2中成员变量首地址放入eax,作为返回值。构造函数总是返回对象首地址
    mov    esp, ebp
    pop    ebp
    ret    4
??0Y@@QAE@ABV0@@Z ENDP


从代码中可以看到,由于类Y显示定义了拷贝构造函数,编译器也只是负责显示调用,并没有提供任何的拷贝功能。因为在类Y中,拷贝构造函数就是被定义成了一个空函数

 

和继承一样,如果成员对象也没有拷贝构造函数呢?

下面是c++源码:

复制代码 代码如下:


class Y {
private:
    int j;

 

};
class X  {
private:
    int i;
    int j;
    Y y;
};


int main() {
    X x1;//先定义对象x1
    X x2 = x1;//将x1拷贝给x2
}


下面是对象的汇编码:

复制代码 代码如下:


_main    PROC

 

; 14   : int main() {

    push    ebp
    mov    ebp, esp
    sub    esp, 24                    ; 00000018H

; 15   :     X x1;//先定义对象x1
; 16   :     X x2 = x1;//将x1拷贝给x2

    mov    eax, DWORD PTR _x1$[ebp];将x1中首地址的内容写入eax,即将x1中的成员变量值i写入eax
    mov    DWORD PTR _x2$[ebp], eax;将eax的值写入x2的首地址处,即将eax的值写入x2的成员变量i
    mov    ecx, DWORD PTR _x1$[ebp+4];将偏移x1首地址4byte处的内存里面的内容写入ecx,即将x1中成员变量j的值写入ecx
    mov    DWORD PTR _x2$[ebp+4], ecx;将ecx的值写入偏移x2首地址4byte处的内存,即将ecx的值写入x2中成员变量j
    mov    edx, DWORD PTR _x1$[ebp+8];将偏移x1首地址8byte处(这里是x1成员对象y的首地址)的内存值写入edx,即将x1中成员对象y中的成员变量i值写入edx
    mov    DWORD PTR _x2$[ebp+8], edx;将edx的值写入偏移x2首地址8byte处(这里是x2成员对象y的首地址)的内存里面,即将edx的值写入x2中成员对象y的成员变量i里面


从汇编吗可以看出,编译器在这种情况下任然只是提供无用的默认拷贝构造函数,即没有显示的函数调用,只是用寄存器和内存之间的通信完成拷贝过程

 

综合上面的分析,可以看到:

对于一个类,如果它没有显示定义拷贝构造函数,编译器并不总是提供非无用的默认拷贝构造函数,除非:

1 该类包含虚函数成员函数(包括继承自虚基类或者继承的基类中有虚函数成员),这时编译器提供为该类提供非无用的默认拷贝构造函数

2 该类继承自一个基类,而基类含有自定义的拷贝函数,这时编译器为该类提供非无用的默认拷贝构造函数。(如果基类本身没有定义拷贝构造函数,但是编译器会为基类提供一个非无用的默认拷贝构造函数,也属于这种情况。也就是说,基类只要含有一个非无用的拷贝构造函数就行,不管这个非无用的拷贝构造函数是自定义的,还是编译器提供的)

3 该类包含一个成员对象,而该成员对象有自定的拷贝构造函数,这时编译器为该类提供非无用的默认拷贝构造函数。(如果成员对象本身没有定义拷贝构造函数,但是编译器会为成员对象提供一个非无用的默认拷贝构造函数,也属于这种情况。也就是说,成员对象只要包含一个非无用的拷贝构造函数就行,不管这个非无用的拷贝构造函数时自定义的,还是编译器提供的。这中情况和上一种类似).

并且,如果一个类自定义了一个拷贝构造函数,编译器只是负责调用,不会额外提供任何拷贝过程;而对于编译器提供的默认拷贝函数,不管是无用的,还是非无用的,都仅仅只是位拷贝(即浅拷贝).