Arm上函数调用的规则在ARM System Developer's Guide文档中的ATPCS部分有详细的定义,这里主要通过函数调用过程中函数栈的情况来说明fp和sp等寄存器的作用。有关ATPCS的详细内容可以去文档中看。
fp叫做frame pointer寄存器,即栈帧指针寄存器;sp叫做stack pointer寄存器,即栈指针寄存器。那么它们具体的作用是什么呢?
首先,大家知道每个进程都有自己独立的栈空间,进程中有千千万万的函数调用,这些函数共享进程的这个栈空间,那么问题就来了,函数运行过程中会有非常多的入栈出栈的过程,当函数返回backtrace的时候怎样能精确定位到返回地址呢?还有子函数所保存的一些寄存器的内容?这样就有了栈帧的概念,即每个函数所使用的栈空间是一个栈帧,所有的栈帧就组成了这个进程完整的栈。而fp就是栈基址寄存器,指向当前函数栈帧的栈底,sp则指向当前函数栈帧的栈顶。通过sp和fp所指出的栈帧可以恢复出母函数的栈帧,以此类推就可以backtrace出所有函数的调用顺序。
那一个函数的栈帧具体的范围什么呢?fp和sp具体应该指向什么位置呢?请看下图:
图1
上图描述的是ARM的栈帧布局方式,main stack frame为调用函数的栈帧,func1 stack frame为当前函数(被调用者)的栈帧,栈底在高地址,栈向下增长。此图是网上的图,理论上应该是上图的格式,fp、sp、lr和pc这四个寄存器是非常特殊的寄存器,它们记录了当前正在运行的函数一些重要信息,在刚进入一个新的函数开始执行的时候,它们保存的是上个函数的信息,需要将它们入栈保存起来,这很重要!这些并没有定义在ATPCS中,ATPCS规定的是函数调用的时候参数如何传递,以及函数返回值的保存等。上面的这些个人觉得是一种默契,定义函数现场的保存及恢复,这些默契包括ATPCS都是人为的一种约束,目的是为了保证程序运行中不会出错,具体怎样实现应该是不同的编译器不尽相同。
下面我为了验证arm的gcc编译器的实现,自己写了个小实验程序:
main.c:
#include <stdio.h>
int func(int i);
int main(void)
{
int i = 25;
func(i);
return 0;
}
func.cint func(int i){ int a = 2; return a * i;}
main.c中调用了func函数,而func函数的实现在func.c文件中。下面是用arm-linux-androideabi-gcc编译后的执行文件反汇编出来的代码:
Disassembly of section .text:
0000822c <func>:
822c: e52db004 push {fp} ; (str fp, [sp, #-4]!)
8230: e28db000 add fp, sp, #0
8234: e24dd014 sub sp, sp, #20
8238: e50b0010 str r0, [fp, #-16]
823c: e3a03002 mov r3, #2
8240: e50b3008 str r3, [fp, #-8]
8244: e51b3008 ldr r3, [fp, #-8]
8248: e51b2010 ldr r2, [fp, #-16]
824c: e0030392 mul r3, r2, r3
8250: e1a00003 mov r0, r3
8254: e24bd000 sub sp, fp, #0
8258: e49db004 pop {fp} ; (ldr fp, [sp], #4)
825c: e12fff1e bx lr
00008260 <main>:
8260: e92d4800 push {fp, lr}
8264: e28db004 add fp, sp, #4
8268: e24dd008 sub sp, sp, #8
826c: e3a03019 mov r3, #25
8270: e50b3008 str r3, [fp, #-8]
8274: e51b0008 ldr r0, [fp, #-8]
8278: ebffffeb bl 822c <func>
827c: e3a03000 mov r3, #0
8280: e1a00003 mov r0, r3
8284: e24bd004 sub sp, fp, #4
8288: e8bd8800 pop {fp, pc}
上面的汇编代码可以看到,并没有想上面图中所画的,将fp, sp, lr, pc全部都入栈,而是只入栈这四个寄存器中有改动的。fp是肯定要保存的,它指向的是每个函数栈帧的栈基址,而sp一般不用入栈,因为它的值一般保存在fp中,因为刚进入一个函数的时候,将上个函数的fp入栈保存以后,当前函数的栈空间应该是空的,fp应该指向与sp相同的位置,然后才会对sp做减法来分配栈空间保存临时变量。而如果当前函数中没有对其它函数的调用的时候,是不会对lr寄存器做修改的,所以也就不用保存了。
但是上面对main函数和func函数的fp指针所指向的位置也不完全相同,main函数中fp指向的是上个fp保存的内存地址,而func中的fp指向的是sp相同的位置。但是只要恢复的时候相对应不出错就可以了,上面也说过ATPCS这些规定都是人为的一种约束,保证backtrace的时候可以把正确的内容恢复到寄存器中,具体怎么实现并没有特别死板的定义。
另外一个比较重要的东西就是出入栈的顺序,在ARM指令系统中是地址递减栈,入栈操作的参数入栈顺序是从右到左依次入栈,而参数的出栈顺序则是从左到右的你操作。包括push/pop和LDMFD/STMFD等。
比如指令 push {fp, sp, lr, pc}执行的结果就是图1中栈的样子,pc被首先入栈存在高地址,从右到左依次入栈,fp存在低地址。
这些是比较细节和基础的东西,同时也是需要搞清楚的。
参考链接:
1. http://www.linuxidc.com/Linux/2013-03/81247.htm
2. http://www.cnblogs.com/chyl411/p/4579053.html
3. http://www.cnblogs.com/fanzhidongyzby/p/5250116.html