【改进版】C++小程序中一个cout输出语句背后的堆栈知识

时间:2024-05-20 15:36:08

最开始写这篇文章的时候,凭着自己对汇编的一点理解就堆出了这些内容,经 egmkang的指点,才发觉自己是井底之蛙,花了半天的功夫,去学习顺序点等内容。针对上次写的程序,我决定添一些内容,把程序2后面的汇编的东西整出来,整理下思路,希望大家看得懂。

下面是第一稿的内容,原封不动


C++中的cout是最常见的,假如cout后面有多个输出的话,他们的输出顺序是什么呢?决定他们输出顺序背后的原理是什么呢?先看下面的代码(1):

 #include<iostream>
 using namespace std;
 int abs(int a);
 int main()
 {    ;
     cout<<a<<endl<<abs(a)<<endl;
 }
 int abs(int a)
 {    cout<<"int a"<<endl;
     ?a:-a);
 }

大家看一眼第6行的输出结果:很多人认为是-5

int a

5

可实际的结果是这样吗?看下图

【改进版】C++小程序中一个cout输出语句背后的堆栈知识图(1)

是不是与我们期望的不一样?

最后的输出结果与cout背后的汇编中堆栈有很大联系,我们知道汇编中堆栈是“后入先出”的存储区,执行第6行语句,从右向左依次把要输出的值压入堆栈,最后从上到下依次输出,第6行的汇编伪代码如下(以下代码不是严格意义上的汇编代码,为容易理解而写成):

push  endl;//把换行符压入

push  abs(a);//压入函数返回值,函数返回值压入堆栈需要两步:首先先执行cout<<"int a"<<endl;这行语句,故屏幕先显示出int a,然后计算a的绝对值并压入堆栈

push  endl;

push  a;输出a的值

到此所有的值都压入堆栈,并且此过程中执行其他语句(第9行)的输出结果在屏幕上已经显示出来,然后堆栈中的值依次出栈,在屏幕上先显示-5,再显示5;

假如还有点迷糊的话,再看一个例子(代码2):

 #include<iostream>
 using namespace std;
 int abs(int a);
 float abs(float b);
 int main()
 {    ;
     float c=-2.4f;
     cout<<"a="<<abs(a)<<endl<<"c="<<abs(c)<<endl;
     ;
 }
 int abs(int a)
 {    cout<<"int abs"<<endl;
     ?a:-a);
 }
 float abs(float b)
 {    cout<<"float abs"<<endl;
     ?b:-b);
 }

假如还按照原来的感觉,那么输出顺序应该是a=int abs

5

c=float  abs

2.4

运行结果如下图:

【改进版】C++小程序中一个cout输出语句背后的堆栈知识图(2)

还是按照上面提到的汇编的方法分析下,压入堆栈的汇编伪代码如下:

push   endl;

push   abs(c);//需要强调的是这一步中 float abs立刻在屏幕中显示出来,无需等到所有的值压入堆栈完毕

push   c=;

push    endl;

push   abs(a);//这一步也立刻把int  abs显示出来,显示在float  abs下面

push   a=;

等上面所有的步骤执行完后,然后堆栈中的值依次出栈,最后的输出结果如图(2),代码(2)用到了重载函数,也是很有趣的知识。顺便提一句,在重载函数中,任意两个函数的参数表中函数的个数,各参数的数据类型和顺序不能完全一样,如int  func(int a,char b,float c)和double  func(int  d,char e,float f)。


然后是 egmkang的评论,希望大家要重点看看的:

【改进版】C++小程序中一个cout输出语句背后的堆栈知识

【改进版】C++小程序中一个cout输出语句背后的堆栈知识


今天特意反汇编程序2了一下,主要代码及其解释如下,可以结合上面的伪代码看一下(下面附加的解释有些地方可能不是很准确,望包涵):

],0FFFFFFFBh                 //a=-,把-5这个值放入[ebp-]这个地址单元中
:        float c=-.4f;
],0C019999Ah                 //c=--.4f,把-.4f这个值放入[ebp-]这个地址单元中
:        cout<<"a="<<abs(a)<<endl<<"c="<<abs(c)<<endl;
(std::endl) (004010c8)        //@ILT其实就是一个静态的表,它记录了一些函数的入口然后跳过去,
                                                                     每个跳转jmp占一个字节,然后就是一个四字节的内存地址,所以加起为五个字节
]
004015CE   push        eax                                     //c的值压入堆栈
(abs) ((?abs@@YAMM@Z):004011FE  jmp  abs (004016e0),float abs的地址正是004016e0
004015D4   fstp        dword ptr [esp]                               //浮点保存出栈
004015D7   push        offset string "c=" (0046f020)                 //"c="这个字符串入栈,其实是这个字符串所在的内存单元的偏移地址入栈
(std::endl) (004010c8)         //把(std::endl)的入口地址压栈
]
004015E4   push        ecx                                      //a的值入栈
(_abs) ((_abs):  ),int abs的地址正是00401660

004015ED   push        eax                                  //int abs函数返回的结果放在eax中
004015EE   push        offset string "a=" (0046f01c)         //"a="这个字符串入栈,其实是这个字符串所在的内存单元的偏移地址入栈
004015F3   push        offset std::cout (0047ce90)
()          

   mov         ecx,eax
   (std::basic_ostream<char,std::char_traits<char> >::operator<<) (004010ff)
   mov         ecx,eax
   (std::basic_ostream<char,std::char_traits<char> >::operator<<) (004011ea)
0040160E   push        eax
()

   mov         ecx,eax
   (std::basic_ostream<char,std::char_traits<char> >::operator<<) (0040112c)
0040161E   mov         ecx,eax
   (std::basic_ostream<char,std::char_traits<char> >::operator<<) (004011ea)   

下面是函数入口的静态表:

@ILT+(?endl@std@@YAAAV?$basic_ostream@DU?$char_traits@D@std@@@1@AAV21@@Z):
004010C8   jmp         std::endl (004026f0)

@ILT+(???$basic_ostream@DU?$char_traits@D@std@@@std@@QAEAAV01@H@Z):
004010FF   jmp         std::basic_ostream<char,std::char_traits<char> >::operator<< (004017d0)

@ILT+(???$basic_ostream@DU?$char_traits@D@std@@@std@@QAEAAV01@M@Z):
0040112C   jmp         std::basic_ostream<char,std::char_traits<char> >::operator<< (00401a40)

@ILT+(_abs):
)

@ILT+(???$basic_ostream@DU?$char_traits@D@std@@@std@@QAEAAV01@P6AAAV01@AAV01@@Z@Z):
)

@ILT+(?abs@@YAMM@Z):
004011FE   jmp         abs (004016e0)

@ILT+(??6std@@YAAAV?$basic_ostream@DU?$char_traits@D@std@@@0@AAV10@PBD@Z):
   jmp         std::operator<< (00402d70)

cout<<"a="<<abs(a)<<endl<<"c="<<abs(c)<<endl;这行代码中虽然都调用了abs函数,但是调用的地址是不一样的,abs(c)最后跳到地址为004016e0的地方,而函数float abs(float b)的地址正好是004016e0。abs(a)最后跳到地址为00401660的地方,而函数int abs(int a)的地址正好是00401660。

假如发现了什么问题,大家踊跃评论,我会完善的。