一。理论篇
在进行深入学习和分析之前,还是先看看书中是怎么介绍成员函数的。总结一下类成员函数指针的内容,应该包含以下几个知识点:
1。成员函数指针并不是普通的函数指针。
2。编译器提供了几个新的操作符来支持成员函数指针操作:
1
) 操作符
"
::*
"
用来声明一个类成员函数指针,例如:
typedef void (Base::*PVVBASEMEMFUNC)( void ); //Base is a class
2 ) 操作符 " ->* " 用来通过对象指针调用类成员函数指针,例如:
//pBase is a Base pointer and well initialized
//pVIBaseMemFunc is a member function pointer and well initialized
(pBase->*pVIBaseMemFunc)();
3) 操作符".*"用来通过对象调用类成员函数指针,例如:
//baseObj is a Base object
//pVIBaseMemFunc is a member function pointer and well initialized
(baseObj.*pVIBaseMemFunc)();
typedef void (Base::*PVVBASEMEMFUNC)( void ); //Base is a class
2 ) 操作符 " ->* " 用来通过对象指针调用类成员函数指针,例如:
//pBase is a Base pointer and well initialized
//pVIBaseMemFunc is a member function pointer and well initialized
(pBase->*pVIBaseMemFunc)();
3) 操作符".*"用来通过对象调用类成员函数指针,例如:
//baseObj is a Base object
//pVIBaseMemFunc is a member function pointer and well initialized
(baseObj.*pVIBaseMemFunc)();
3。成员函数指针是强类型的。
typedef
void
(Base::
*
PVVBASEMEMFUNC)(
void
);
typedef void (Derived:: * PVVDERIVEMEMFUNC)( void );
PVVBASEMEMFUNC和PVVDERIVEMEMFUNC是两个不同类型的成员函数指针类型。
typedef void (Derived:: * PVVDERIVEMEMFUNC)( void );
PVVBASEMEMFUNC和PVVDERIVEMEMFUNC是两个不同类型的成员函数指针类型。
4。由于成员函数指针并不是真真意义上的指针,所以成员函数指针的转化就受限制。具体的转化细节依赖于不同的编译器,甚至是同一个编译器的不同版本。不过,处于同一个继承链中的不同类之间override的不同函数和虚函数还是可以转化的。
void
*
pVoid
=
reinterpret_cast
<
void
*>
(pVIBaseMemFunc);
//
error
int * pInt = reinterpret_cast < int *> (pVIBaseMemFunc); // error
pVIDeriveMemFunc = static_cast < PVIDERIVEMEMFUNC > (pVIBaseMemFunc); // OK
int * pInt = reinterpret_cast < int *> (pVIBaseMemFunc); // error
pVIDeriveMemFunc = static_cast < PVIDERIVEMEMFUNC > (pVIBaseMemFunc); // OK
二。实践篇
有了上面的理论知识,我们对类成员函数指针有了大概的了解,但是我们对成员函数指针还存在太多的疑惑。既然说成员函数指针不是指针,那它到底是什么东东? 编译器为什么要限制成员函数指针转化?老办法,我们还是分析汇编代码揭示其中的秘密。 首先,我写了这样两个具有继承关系的类:
class
Base {
public :
// ordinary member function
void setValue( int iValue);
// virtual member function
virtual void dumpMe();
virtual void foobar();
protected :
int m_iValue;
};
class Derived: public Base{
public :
// ordinary member function
void setValue( int iValue);
// virtual member function
virtual void dumpMe();
virtual void foobar();
private :
double m_fValue;
};
public :
// ordinary member function
void setValue( int iValue);
// virtual member function
virtual void dumpMe();
virtual void foobar();
protected :
int m_iValue;
};
class Derived: public Base{
public :
// ordinary member function
void setValue( int iValue);
// virtual member function
virtual void dumpMe();
virtual void foobar();
private :
double m_fValue;
};
接着,我又定义了一些成员函数指针类型:
typedef
void
(Base::
*
PVVBASEMEMFUNC)(
void
);
typedef void (Derived:: * PVVDERIVEMEMFUNC)( void );
typedef void (Base:: * PVIBASEMEMFUNC)( int );
typedef void (Derived:: * PVIDERIVEMEMFUNC)( int );
typedef void (Derived:: * PVVDERIVEMEMFUNC)( void );
typedef void (Base:: * PVIBASEMEMFUNC)( int );
typedef void (Derived:: * PVIDERIVEMEMFUNC)( int );
最后,在main函数写了一些测试代码:
int
_tmain(
int
argc, _TCHAR
*
argv[])
{
PVIBASEMEMFUNC pVIBaseMemFunc = & Base::setValue;
PVIDERIVEMEMFUNC pVIDeriveMemFunc = static_cast < PVIDERIVEMEMFUNC > (pVIBaseMemFunc);
PVVBASEMEMFUNC pVVBaseMemFunc = & Base::foobar;
PVVDERIVEMEMFUNC pVVDeriveMemFunc = static_cast < PVVDERIVEMEMFUNC > (pVVBaseMemFunc);
Base baseObj;
(baseObj. * pVIBaseMemFunc)( 10 );
(baseObj. * pVVBaseMemFunc)();
Derived deriveObj;
(deriveObj. * pVIDeriveMemFunc)( 20 );
(deriveObj. * pVVDeriveMemFunc)();
return 0 ;
}
{
PVIBASEMEMFUNC pVIBaseMemFunc = & Base::setValue;
PVIDERIVEMEMFUNC pVIDeriveMemFunc = static_cast < PVIDERIVEMEMFUNC > (pVIBaseMemFunc);
PVVBASEMEMFUNC pVVBaseMemFunc = & Base::foobar;
PVVDERIVEMEMFUNC pVVDeriveMemFunc = static_cast < PVVDERIVEMEMFUNC > (pVVBaseMemFunc);
Base baseObj;
(baseObj. * pVIBaseMemFunc)( 10 );
(baseObj. * pVVBaseMemFunc)();
Derived deriveObj;
(deriveObj. * pVIDeriveMemFunc)( 20 );
(deriveObj. * pVVDeriveMemFunc)();
return 0 ;
}
成功编译后生成汇编代码。老规矩,在分析汇编代码的过程中还是只分析对解决问题有意义的汇编代码,其他的就暂时忽略。
1。成员函数指针不是指针。从代码看出,在main函数的调用栈(calling stack)中首先依次压入四个成员函数指针,如果它们是普通指针的话,它们之间的偏移量应该是4个字节,可是实际的情况却是这样的:
_deriveObj$ = -88
_baseObj$ = -60
_pVVDeriveMemFunc$ = -44
_pVVBaseMemFunc$ = -32
_pVIDeriveMemFunc$ = -20
_pVIBaseMemFunc$ = -8
_argc$ = 8
_argv$ = 12
_baseObj$ = -60
_pVVDeriveMemFunc$ = -44
_pVVBaseMemFunc$ = -32
_pVIDeriveMemFunc$ = -20
_pVIBaseMemFunc$ = -8
_argc$ = 8
_argv$ = 12
由此可以看出,他们之间的偏移量是12个字节。这12个字节中应该可以包含三个指针,其中的一个指针应该指向函数的地址,那另外两个指针又指向那里呢?在《C++ Common Knowledge: Essential Intermediate Programming》(中文译名: C++必知必会 )这本书的第16章对这部分的内容做了说明,这个12个字节的偏移量正好印证了书中的内容:
”The implementation of the pointer to member function must store within itself information as to whether the member function to which it refers is virtual or nonvirtual, information about where to find the appropriate virtual function table pointer (see The Compiler Puts Stuff in Classes [11, 37]), an offset to be added to or subtracted from the function's this pointer (see Meaning of Pointer Comparison [28, 97]), and possibly other information. A pointer to member function is commonly implemented as a small structure that contains this information, although many other implementations are also in use. Dereferencing and calling a pointer to member function usually involves examining the stored information and conditionally executing the appropriate virtual or nonvirtual function calling sequence.“
2。成员函数指针的转化。本文所采用的代码是想比较普通成员函数指针和虚函数指针在转化的过程中存在那些差异:
; PVIBASEMEMFUNC pVIBaseMemFunc
=
&
Base::setValue;
mov DWORD PTR _pVIBaseMemFunc$[ebp], OFFSET FLAT: ? setValue@Base@@QAEXH@Z ;
取出Base::setValue函数的地址,存放于变量pVIBaseMemFunc所占内存的前4个字节(DWORD)中。
mov DWORD PTR _pVIBaseMemFunc$[ebp], OFFSET FLAT: ? setValue@Base@@QAEXH@Z ;
取出Base::setValue函数的地址,存放于变量pVIBaseMemFunc所占内存的前4个字节(DWORD)中。
; PVVBASEMEMFUNC pVVBaseMemFunc
=
&
Base::foobar;
mov DWORD PTR _pVVBaseMemFunc$[ebp], OFFSET FLAT: ?? _9@$B3AE ; `vcall '
取出符号” ?? _9@$B3AE“的值,存放于变量pVVBaseMemFunc所占内存的前4个字节(DWORD)中。
mov DWORD PTR _pVVBaseMemFunc$[ebp], OFFSET FLAT: ?? _9@$B3AE ; `vcall '
取出符号” ?? _9@$B3AE“的值,存放于变量pVVBaseMemFunc所占内存的前4个字节(DWORD)中。
对于符号”??_9@$B3AE“,我又找到了这样的 汇编代码:
_TEXT SEGMENT
?? _9@$B3AE PROC NEAR ; `vcall ' , COMDAT
mov eax, DWORD PTR [ecx]
jmp DWORD PTR [eax + 4 ]
?? _9@$B3AE ENDP ; `vcall '
_TEXT ENDS
符号” ?? _9@$B3AE“代表的应该是一个存根函数,这个函数首先根据this指针获得虚函数表的指针,然后将指令再跳转到相应的虚函数的地址。
?? _9@$B3AE PROC NEAR ; `vcall ' , COMDAT
mov eax, DWORD PTR [ecx]
jmp DWORD PTR [eax + 4 ]
?? _9@$B3AE ENDP ; `vcall '
_TEXT ENDS
符号” ?? _9@$B3AE“代表的应该是一个存根函数,这个函数首先根据this指针获得虚函数表的指针,然后将指令再跳转到相应的虚函数的地址。
; PVIDERIVEMEMFUNC pVIDeriveMemFunc
=
static_cast
<
PVIDERIVEMEMFUNC
>
(pVIBaseMemFunc);
mov eax, DWORD PTR _pVIBaseMemFunc$[ebp]
mov DWORD PTR _pVIDeriveMemFunc$[ebp], eax
直接将变量pVIBaseMemFunc所占内存的前4个字节(DWORD)的值付给了变量_pVIDeriveMemFunc所占内存的前4个字节中。
mov eax, DWORD PTR _pVIBaseMemFunc$[ebp]
mov DWORD PTR _pVIDeriveMemFunc$[ebp], eax
直接将变量pVIBaseMemFunc所占内存的前4个字节(DWORD)的值付给了变量_pVIDeriveMemFunc所占内存的前4个字节中。
; PVVDERIVEMEMFUNC pVVDeriveMemFunc
=
static_cast
<
PVVDERIVEMEMFUNC
>
(pVVBaseMemFunc);
mov eax, DWORD PTR _pVVBaseMemFunc$[ebp]
mov DWORD PTR _pVVDeriveMemFunc$[ebp], eax
直接将变量pVVBaseMemFunc所占内存的前4个字节(DWORD)的值付给了变量pVVDeriveMemFunc所占内存的前4个字节中。
mov eax, DWORD PTR _pVVBaseMemFunc$[ebp]
mov DWORD PTR _pVVDeriveMemFunc$[ebp], eax
直接将变量pVVBaseMemFunc所占内存的前4个字节(DWORD)的值付给了变量pVVDeriveMemFunc所占内存的前4个字节中。
3。函数调用
下面的函数调用都大同小异,这里是列出其中的一个:
; (baseObj.
*
pVIBaseMemFunc)(
10
);
mov esi, esp
push 10 ; 0000000aH
lea ecx, DWORD PTR _baseObj$[ebp]
call DWORD PTR _pVIBaseMemFunc$[ebp]
cmp esi, esp
call __RTC_CheckEsp
mov esi, esp
push 10 ; 0000000aH
lea ecx, DWORD PTR _baseObj$[ebp]
call DWORD PTR _pVIBaseMemFunc$[ebp]
cmp esi, esp
call __RTC_CheckEsp
到了这里,我们应该对成员函数指针有了进一步的了解。
历史:
11/25/2006 v1.0
原文的第一个正式版
参考文献:
1。 《C++ Common Knowledge: Essential Intermediate Programming》By Stephen C. Dewhurst