今天来研究一下编译时多态和运行时多态。
运行时的多态,比如C++用虚函数,或者比如有些语言支持委托。这样实际运行的代码是运行时决定的,这样必须要承担一定的开销:
1、间接调用。比如说虚表。
2、调用的函数编译期不能确定,所以不能展开。
这样性能上是有很大的损失的。如果这个调用出现在一个循环里,或者被其他地方频繁的调用,效率会有很大的差距。
其实有些时候,我们并不是真的需要真正的运行时多态,有时可能就是编译期的多态。
举例:
{
public:
virtual void Open() = 0;
virtual ~ServerBase() {};
} ;
class FtpServer
{
public:
virtual void Open()
{
//
}
} ;
class HttpServer
{
public:
virtual void Open()
{
//
}
} ;
然后你的程序里使用起来是这样的:
pServer->Open();
这样你做了个HttpServer。如果这里就是个具体应用,没有要求你运行期间能替换协议,那么这个设计明显有额外的开销。让我们先做几个例子来看看调用一个函数的开销。
例子:
{
public:
void MemberFunction()
{
std::cout<<"MemberFunction Base";
}
virtual void VirtualFunction()
{
std::cout<<"VirtualFunction Base";
}
virtual ~CPolymorphismBase() {}
} ;
class CPolymorphismDerived : public CPolymorphismBase
{
public:
void MemberFunction()
{
std::cout<<"MemberFunction Derived";
}
virtual void VirtualFunction()
{
std::cout<<"VirtualFunction Derived";
}
} ;
首先我们来看看普通的成员函数的开销是怎么样的。
CPolymorphismDerived* pDerivedObject = new CPolymorphismDerived();
derivedObject.MemberFunction();
pDerivedObject->MemberFunction();
运行一下,看到汇编内容如下:
00401034 mov eax,dword ptr [__imp_std::cout (40204Ch)]
00401039 push offset string "MemberFunction Derived" (40213Ch)
0040103E push eax
0040103F call std::operator<<<std::char_traits<char> > (401190h)
pDerivedObject-> MemberFunction();
00401044 mov ecx,dword ptr [__imp_std::cout (40204Ch)]
0040104A push offset string "MemberFunction Derived" (40213Ch)
0040104F push ecx
00401050 call std::operator<<<std::char_traits<char> > (401190h)
可以看到,函数不但没有虚表的开销,而且已经在这里展开了,编译器替我们完成了inline优化,这样的效率当然是最高的。
然后我们来看虚函数。
CPolymorphismDerived* pDerivedObject = new CPolymorphismDerived();
CPolymorphismBase* pDerivedObjectBasePoint = pDerivedObject;
derivedObject.VirtualFunction();
pDerivedObject-> VirtualFunction();
pDerivedObjectBasePoint->VirtualFunction();
运行一下,看到汇编内容如下:
0040103B mov eax,dword ptr [__imp_std::cout (40204Ch)]
00401040 push offset string "VirtualFunction Derived" (40213Ch)
00401045 push eax
00401046 call std::operator<<<std::char_traits<char> > (4011A0h)
pDerivedObject-> VirtualFunction();
0040104B mov edx,dword ptr [esi]
0040104D mov eax,dword ptr [edx]
0040104F add esp,8
00401052 mov ecx,esi
00401054 call eax
pDerivedObjectBasePoint-> VirtualFunction();
00401056 mov edx,dword ptr [esi]
00401058 mov eax,dword ptr [edx]
0040105A mov ecx,esi
0040105C call eax
栈上分配出来的那个对象,虽然是虚函数,但是编译期是确定的,所以没有虚表的开销,函数也成功展开了。
堆上new出来的那个对象,就不走运了。不管是基类指针还是派生类指针去操作,都有虚表的开销,同时函数也无法展开。
这是什么意思呢?就是说即时一开始的例子改成这样也一样性能很低下
HttpServer* pServer = new HttpServer(); // 那我换成这样写吧!!!
pServer->Open(); // but,即使不用基类指针操作,效率也是一样低。
我们来总结一下吧
性能 | 栈上分配 | 堆分配 + 父类指针 | 堆分配 + 子类指针 |
普通成员函数 | 高 | 高 | 高 |
虚函数 | 高 | 低 | 低 |
下面切入正题。
要让用户使用起来性能得到保障,就只有用普通成员函数了。(你总不能强制用户必须使用栈对象吧?)
既然是普通成员函数,那也就没ServerBase什么事了。(既然不使用虚函数,那么一个基类的指针也就调用不到子类了,所以这里弄个基类没什么用了。)所以,代码修改如下了:
{
public:
void Open()
{
//
}
} ;
class HttpServer
{
public:
void Open()
{
//
}
} ;
所以使用的时候就可以这么写了:
typedef HttpServer Server;
ServerBase* pServer = new Server();
pServer->Open();
//
这样,就可以了,什么时候需要一个Ftp的版本了,就可以简单修改头两行代码,别的都不用改,这样就是一个FtpServer了:
typedef FtpServer Server;
ServerBase* pServer = new Server();
pServer->Open();
//
这里也可以用模板:
class App
{
public:
typedef T ServerBase;
typedef T Server;
static void main()
{
ServerBase* pServer = new Server();
pServer->Open();
//
}
} ;
App<FtpServer>::main(); // 这就是Ftp的
//App<HttpServer>::main(); // 这就是Http的
这就是编译期的多态,都用普通成员函数,使用到多态对象的类可以使用模板来简化多态时的修改(都用模板,然后在外部整体一个typedef就可以把所有需要多态的类都提纯出来,一个修改就可以让全程序得到效果)。
当然,并不是到这就结束了。。。你的HttpServer和FtpServer都改好了。。。但是你的BOSS过来和你说:兄弟,新需求,需要允许运行时修改协议,允许热配置。然后你就发现:坏了,二了,咱已经改成编译期多态的了。。。
这该怎么办呢?怎么让你设计的类既能配置成编译期多态而且不损效率,又能配置成运行时多态呢?
这里可以用个Adapter来做。
class Server_Adapter : public ServerBase
{
public:
Server_Adapter()
{
}
virtual ~Server_Adapter()
{
}
virtual void Open()
{
m_server.Open();
}
private:
T m_server;
} ;
这样就OK了。使用者如果需要编译期多态,就像上一个例子那么用就可以了,性能没问题;如果需要运行期多态,那就这么写:
typedef Server_Adapter<HttpServer> HttpServerObject;
typedef Server_Adapter<FtpServer> FtpServerObject;
ServerBaseObject* pServer = NULL;
int nServerType = ; // 这里可以动态得到,从配置文件里头读啊什么的,反正都行,运行时随便改。
switch (nServerType)
{
case 0:
{
pServer = new HttpServerObject();
}
break;
case 1:
{
pServer = new FtpServerObject();
}
break;
default:
//
break;
}
pServer -> Open();
//
这样就运行时多态了,一点毛病没有。和一开始的方案比,没有一丝性能损失。也许你要问了:这不是多包了一层么?调用Open的时候,要多一次函数调用呀?当然不会了。。。作为Adapter的T来说,编译期是确定的,所以内部的对象m_server作为一个栈对象,调用的函数是可以展开的。我们还是看一下具体的汇编代码:
00401030 mov eax,dword ptr [__imp_std::cout (402050h)]
00401035 push eax
00401036 call std::operator<<<std::char_traits<char> > (401190h)
0040103B pop ecx
可见,这里的代码展开了,您可以试验一下在HttpServer::Open和FtpServer::Open那里下个断点,就会发现根本断不下来,因为那里的代码已经展开在Server_Adapter<HttpServer>和Server_Adapter<FtpServer>里头了,根本没有间接调用的问题。
这样,一个兼顾效率和灵活性的完美类库产生了。