最开始写这篇文章的时候,凭着自己对汇编的一点理解就堆出了这些内容,经 egmkang的指点,才发觉自己是井底之蛙,花了半天的功夫,去学习顺序点等内容。针对上次写的程序,我决定添一些内容,把程序2后面的汇编的东西整出来,整理下思路,希望大家看得懂。
下面是第一稿的内容,原封不动
C++中的cout是最常见的,假如cout后面有多个输出的话,他们的输出顺序是什么呢?决定他们输出顺序背后的原理是什么呢?先看下面的代码(1):
#include<iostream> using namespace std; int abs(int a); int main() { ; cout<<a<<endl<<abs(a)<<endl; } int abs(int a) { cout<<"int a"<<endl; ?a:-a); }
大家看一眼第6行的输出结果:很多人认为是-5
int a
5
可实际的结果是这样吗?看下图
图(1)
是不是与我们期望的不一样?
最后的输出结果与cout背后的汇编中堆栈有很大联系,我们知道汇编中堆栈是“后入先出”的存储区,执行第6行语句,从右向左依次把要输出的值压入堆栈,最后从上到下依次输出,第6行的汇编伪代码如下(以下代码不是严格意义上的汇编代码,为容易理解而写成):
push endl;//把换行符压入
push abs(a);//压入函数返回值,函数返回值压入堆栈需要两步:首先先执行cout<<"int a"<<endl;这行语句,故屏幕先显示出int a,然后计算a的绝对值并压入堆栈
push endl;
push a;输出a的值
到此所有的值都压入堆栈,并且此过程中执行其他语句(第9行)的输出结果在屏幕上已经显示出来,然后堆栈中的值依次出栈,在屏幕上先显示-5,再显示5;
假如还有点迷糊的话,再看一个例子(代码2):
#include<iostream> using namespace std; int abs(int a); float abs(float b); int main() { ; float c=-2.4f; cout<<"a="<<abs(a)<<endl<<"c="<<abs(c)<<endl; ; } int abs(int a) { cout<<"int abs"<<endl; ?a:-a); } float abs(float b) { cout<<"float abs"<<endl; ?b:-b); }
假如还按照原来的感觉,那么输出顺序应该是a=int abs
5
c=float abs
2.4
运行结果如下图:
图(2)
还是按照上面提到的汇编的方法分析下,压入堆栈的汇编伪代码如下:
push endl;
push abs(c);//需要强调的是这一步中 float abs立刻在屏幕中显示出来,无需等到所有的值压入堆栈完毕
push c=;
push endl;
push abs(a);//这一步也立刻把int abs显示出来,显示在float abs下面
push a=;
等上面所有的步骤执行完后,然后堆栈中的值依次出栈,最后的输出结果如图(2),代码(2)用到了重载函数,也是很有趣的知识。顺便提一句,在重载函数中,任意两个函数的参数表中函数的个数,各参数的数据类型和顺序不能完全一样,如int func(int a,char b,float c)和double func(int d,char e,float f)。
然后是 egmkang的评论,希望大家要重点看看的:
今天特意反汇编程序2了一下,主要代码及其解释如下,可以结合上面的伪代码看一下(下面附加的解释有些地方可能不是很准确,望包涵):
],0FFFFFFFBh //a=-,把-5这个值放入[ebp-]这个地址单元中 : float c=-.4f; ],0C019999Ah //c=--.4f,把-.4f这个值放入[ebp-]这个地址单元中 : cout<<"a="<<abs(a)<<endl<<"c="<<abs(c)<<endl; (std::endl) (004010c8) //@ILT其实就是一个静态的表,它记录了一些函数的入口然后跳过去, 每个跳转jmp占一个字节,然后就是一个四字节的内存地址,所以加起为五个字节 ] 004015CE push eax //c的值压入堆栈 (abs) ((?abs@@YAMM@Z):004011FE jmp abs (004016e0),float abs的地址正是004016e0 004015D4 fstp dword ptr [esp] //浮点保存出栈 004015D7 push offset string "c=" (0046f020) //"c="这个字符串入栈,其实是这个字符串所在的内存单元的偏移地址入栈 (std::endl) (004010c8) //把(std::endl)的入口地址压栈 ] 004015E4 push ecx //a的值入栈 (_abs) ((_abs): ),int abs的地址正是00401660 004015ED push eax //int abs函数返回的结果放在eax中 004015EE push offset string "a=" (0046f01c) //"a="这个字符串入栈,其实是这个字符串所在的内存单元的偏移地址入栈 004015F3 push offset std::cout (0047ce90) () mov ecx,eax (std::basic_ostream<char,std::char_traits<char> >::operator<<) (004010ff) mov ecx,eax (std::basic_ostream<char,std::char_traits<char> >::operator<<) (004011ea) 0040160E push eax () mov ecx,eax (std::basic_ostream<char,std::char_traits<char> >::operator<<) (0040112c) 0040161E mov ecx,eax (std::basic_ostream<char,std::char_traits<char> >::operator<<) (004011ea) 下面是函数入口的静态表: @ILT+(?endl@std@@YAAAV?$basic_ostream@DU?$char_traits@D@std@@@1@AAV21@@Z): 004010C8 jmp std::endl (004026f0) @ILT+(???$basic_ostream@DU?$char_traits@D@std@@@std@@QAEAAV01@H@Z): 004010FF jmp std::basic_ostream<char,std::char_traits<char> >::operator<< (004017d0) @ILT+(???$basic_ostream@DU?$char_traits@D@std@@@std@@QAEAAV01@M@Z): 0040112C jmp std::basic_ostream<char,std::char_traits<char> >::operator<< (00401a40) @ILT+(_abs): ) @ILT+(???$basic_ostream@DU?$char_traits@D@std@@@std@@QAEAAV01@P6AAAV01@AAV01@@Z@Z): ) @ILT+(?abs@@YAMM@Z): 004011FE jmp abs (004016e0) @ILT+(??6std@@YAAAV?$basic_ostream@DU?$char_traits@D@std@@@0@AAV10@PBD@Z): jmp std::operator<< (00402d70)
cout<<"a="<<abs(a)<<endl<<"c="<<abs(c)<<endl;这行代码中虽然都调用了abs函数,但是调用的地址是不一样的,abs(c)最后跳到地址为004016e0的地方,而函数float abs(float b)的地址正好是004016e0。abs(a)最后跳到地址为00401660的地方,而函数int abs(int a)的地址正好是00401660。
假如发现了什么问题,大家踊跃评论,我会完善的。