C程序汇编运行模式简析

时间:2024-01-01 12:27:57

SJTUBEAR 原创作品转载请注明出处 /《Linux内核分析》MOOC课程http://mooc.study.163.com/course/USTC-1000029000

1. 汇编

在修习LINUX内核这门课的初始阶段,首先需要掌握的就是汇编以及汇编程序对于堆栈的操作。

下面我们就来分析一下一个简单地C程序是如何被汇编程序所表达的!

2. 得到汇编代码

首先,我们写一个简单地C程序,命名为exp1.c:

 #include <stdio.h>

 int g(int x)
{
return x+;
} int f(x)
{
return g(x);
} int main()
{
return f()+;
}

程序非常的简单,我们此时再通过编译指令将其编译为汇编程序:

 gcc –S –o main.s main.c -m32

这样我们就得到了这个简单C程序的汇编代码:

     .file    "exp1.c"
.text
.globl g
.type g, @function
g:
.LFB0:
.cfi_startproc
pushl %ebp
.cfi_def_cfa_offset
.cfi_offset , -
movl %esp, %ebp
.cfi_def_cfa_register
movl (%ebp), %eax
addl $, %eax
popl %ebp
.cfi_def_cfa ,
.cfi_restore
ret
.cfi_endproc
.LFE0:
.size g, .-g
.globl f
.type f, @function
f:
.LFB1:
.cfi_startproc
pushl %ebp
.cfi_def_cfa_offset
.cfi_offset , -
movl %esp, %ebp
.cfi_def_cfa_register
subl $, %esp
movl (%ebp), %eax
movl %eax, (%esp)
call g
leave
.cfi_restore
.cfi_def_cfa ,
ret
.cfi_endproc
.LFE1:
.size f, .-f
.globl main
.type main, @function
main:
.LFB2:
.cfi_startproc
pushl %ebp
.cfi_def_cfa_offset
.cfi_offset , -
movl %esp, %ebp
.cfi_def_cfa_register
subl $, %esp
movl $, (%esp)
call f
addl $, %eax
leave
.cfi_restore
.cfi_def_cfa ,
ret
.cfi_endproc
.LFE2:
.size main, .-main
.ident "GCC: (Ubuntu/Linaro 4.6.3-1ubuntu5) 4.6.3"
.section .note.GNU-stack,"",@progbits

3.汇编代码分析

汇编出的代码,多了很多辅助信息,为了能够更好地看清主干,我们删减一下:

 g:
pushl %ebp //保存现场,将父函数的栈底寄存器存入当前程序栈中
movl %esp, %ebp //构建当前函数堆栈
movl (%ebp), %eax //从父函数堆栈中取得参数,存入ax寄存器
addl $, %eax //完成+3操作
popl %ebp //恢复原父函数堆栈
ret //pop出原EIP地址,恢复执行
f:
pushl %ebp //保存现场,将父函数的栈底寄存器存入当前程序栈中
movl %esp, %ebp //构建当前函数堆栈
subl $, %esp //栈顶加一,用以储存变量传递给g函数
movl (%ebp), %eax //取得参数
movl %eax, (%esp) //将参数传入变量位置
call g //调用g
leave //清楚局部变量空间
ret //返回
main:
pushl %ebp
movl %esp, %ebp
subl $, %esp //空出局部变量空间
movl $, (%esp) //为变量赋值
call f //调用f
addl $, %eax //完成+1操作
leave //清理局部变量
ret //返回

我们对f函数进行详细的分析:

1. 首先进行enter指令:

此时,ebp当前所指向的位置存入栈顶,并且将ebp重定向指向esp:

C程序汇编运行模式简析

2.栈顶加一并存入变量值:

C程序汇编运行模式简析

3.调用g

C程序汇编运行模式简析

4.从g返回后,返回值储存在AX寄存器中,不用操作,调用leave,清理变量

C程序汇编运行模式简析

5.最后ret,同时EIP被读出恢复到原位置继续执行,返回值在AX中传递给调用函数

C程序汇编运行模式简析

3.个人的一点感悟:

程序的调用就是这样嵌套的执行下去,每个函数都有自己的堆栈用以储存当前变量以及环境值,并通过将父函数的EBP放入栈底用以恢复环境。

同时EIP存入父栈栈顶,便于恢复到原节点处继续执行。

这样,就可以有规律的一直嵌套下去。

如果使用递归函数,就是一个码堆栈的过程,知道最顶部的堆栈返回,函数就像多米诺骨牌一样收回所有的堆栈。

这也是递归函数占用空间比较多的原因之一。如果没有很好地退出机制,有可能内存溢出。