linux 目标文件(*.o) bss,data,text,rodata,堆,栈

时间:2021-09-14 16:15:40

学习于:http://blog.csdn.net/sunny04/article/details/40627311

linux目标文件

一个简单的程序被编译成目标文件后的结构如下:

linux 目标文件(*.o) bss,data,text,rodata,堆,栈

注:初始化为0在此文章中表示为未初始化,后面不再重复!!!特此标出。

从图可以看出,已初始化的全局变量和局部静态变量保存在 .data段中,未初始化的全局变量和未初始化的局部静态变量保存在 .bss段中。


验证代码如下:

/********************start.S******************/.text
.global _start
_start:
ldr sp,= 4096
bl main
halt:
b halt

/********************main.c******************/
int global_init_var = 84;
int global_uninit_var;
int global_0init_var;
void func1( )
{


}
int main(void)
{
static int static_var = 85;
static int static_var2;
static int static_var3 = 0;
int a = 1;
int b;
func1();
return 0;
}

/********************Makefile******************/
all:
arm-linux-gcc -c -o start.o start.S
arm-linux-gcc -c -o main.o main.c
arm-linux-ld -Ttext 0 -Tdata 100 start.o main.o -o sdram.elf
arm-linux-objcopy -O binary -S sdram.elf sdram.bin
arm-linux-objdump -D -m arm sdram.elf > sdram.dis

clean:
rm *.bin *.o *.elf *.dis

/********************sdram.dis******************/

sdram.elf: file format elf32-littlearm

Disassembly of section .text:

00000000 <_start>:
0: e3a0da01 mov sp, #4096 ; 0x1000
4: eb000004 bl 1c <main>

00000008 <halt>:
8: eafffffe b 8 <halt>

0000000c <func1>:
c: e1a0c00d mov ip, sp
10: e92dd800 stmdb sp!, {fp, ip, lr, pc}
14: e24cb004 sub fp, ip, #4 ; 0x4
18: e89da800 ldmia sp, {fp, sp, pc}

0000001c <main>:
1c: e1a0c00d mov ip, sp
20: e92dd800 stmdb sp!, {fp, ip, lr, pc}
24: e24cb004 sub fp, ip, #4 ; 0x4
28: e24dd008 sub sp, sp, #8 ; 0x8
2c: e3a03001 mov r3, #1 ; 0x1
30: e50b3010 str r3, [fp, #-16]
34: ebfffff4 bl c <func1>
38: e3a03000 mov r3, #0 ; 0x0
3c: e1a00003 mov r0, r3
40: e24bd00c sub sp, fp, #12 ; 0xc
44: e89da800 ldmia sp, {fp, sp, pc}
Disassembly of section .data:

00000100 <__data_start>:
100: 00000054 andeq r0, r0, r4, asr r0

00000104 <static_var.0>:
104: 00000055 andeq r0, r0, r5, asr r0
Disassembly of section .bss:

00000108 <static_var2.1>:
108: 00000000 andeq r0, r0, r0

0000010c <static_var3.2>:
10c: 00000000 andeq r0, r0, r0

00000110 <global_uninit_var>:
110: 00000000 andeq r0, r0, r0

00000114 <global_0init_var>:
114: 00000000 andeq r0, r0, r0
Disassembly of section .comment:

00000000 <.comment>:
0: 43434700 cmpmi r3, #0 ; 0x0
4: 4728203a undefined
8: 2029554e eorcs r5, r9, lr, asr #10
c: 2e342e33 mrccs 14, 1, r2, cr4, cr3, {1}
10: Address 0x10 is out of bounds.


目标文件各个段在文件中的布局如下:

linux 目标文件(*.o) bss,data,text,rodata,堆,栈


各个段介绍:

init段:

程序初始化入口代码,在main() 之前运行。

bss段:

BSS段属于静态内存分配。通常是指用来存放程序中未初始化的全局变量和未初始化的局部静态变量。未初始化的全局变量和未初始化的局部静态变量默认值是0,本来这些变量也可以放到data段的,但是因为他们都是0,所以为他们在data段分配空间并且存放数据0是没有必要的。  

程序在运行时,才会给BSS段里面的变量分配内存空间。 

在目标文件(*.o)和可执行文件中,BSS段只是为未初始化的全局变量和未初始化的局部静态变量预留位置而已,它并没有内容,所以它不占据空间。

section table中保存了BSS段(未初始化的全局变量和未初始化的局部静态变量)内存空间大小总和。 (objdump -h *.o 命令可以看到)

data段:

数据段(datasegment)通常是指用来存放程序中已初始化的全局变量和已初始化的静态变量的一块内存区域。数据段属于静态内存分配。

text段:

代码段(codesegment/textsegment)通常是指用来存放程序执行代码的一块内存区域。这部分区域的大小在程序运行前就已经确定,并且内存区域通常属于只读,某些架构也允许代码段为可写,即允许修改程序。在代码段中,也有可能包含一些只读的常数变量,例如字符串常量等。

rodata

存放的是只读数据,比如字符串常量,全局const变量 和 #define定义的常量。例如: char*p="123456", "123456"就存放在rodata段中。

strtab段:

存储的是变量名,函数名等。例如: char* szPath="/root",void func()  变量名szPath 和函数名func 存储在strtab段里。

shstrtab段:

bss,text,data等段名也存储在这里。

rel.text段:

针对 text段的重定位表,还有 rel.data(针对data段的重定位表)

heap堆:

堆是用于存放进程运行中被动态分配的内存段,它的大小并不固定,可动态扩张或缩减。当进程调用malloc等函数分配内存时,新分配的内存就被动态添加到堆上(堆被扩张);当利用free等函数释放内存时,被释放的内存从堆中被剔除(堆被缩减)

stack栈:

是用户存放程序临时创建的局部变量,也就是说我们函数括弧“{}”中定义的变量(但不包括static声明的变量,static意味着在数据段中存放变量)。除此以外,在函数被调用时,其参数也会被压入发起调用的进程栈中,并且待到调用结束后,函数的返回值也会被存放回栈中。由于栈的先进先出特点,所以栈特别方便用来保存/恢复调用现场。从这个意义上讲,我们可以把堆栈看成一个寄存、交换临时数据的内存区。

-----------------------------------------------------------------------------------

验证BSS内存空间

程序1:

int ar[30000];int main(){  return 0;  }

程序2:

int ar[30000] = {0,0};int main(){  return 0;  }

程序3:

int ar[30000] = {1,2,3,4};int main(){  return 0;  }

    结论是:程序3编译之后所得的.exe文件比程序1、2的要大得多。 为什么?

区别很明显,前两个位于.bss段,而另一个位于.data段,两者的区别在于

l          全局的未初始化变量存在于.bss段中,具体体现为一个占位符;全局的已初始化变量存于.data段中;

l          而函数内的自动变量都在栈上分配空间。

l          .bss是不占用.exe文件空间的,其内容由操作系统初始化(清零);

l          而.data却需要占用,其内容由程序初始化,因此造成了上述情况。

 

注意:

1. bss段(未手动初始化的数据)并不给该段的数据分配空间. 程序运行后,系统分配内存空间并由系统初始化,默认内存空间的值都为0.  section table中保存了BSS段(未初始化的全局变量和未初始化的局部静态变量)内存空间大小总和,所以程序运行后,系统知道该分配多少内存给BSS段。

2. data(已手动初始化的数据)段则为数据分配空间,数据保存在目标文件中。


这里有个疑问: data段是变量的内存空间,那是如何区分哪几个字节是变量a的? 哪几个字节是变量b的? 因为变量a,b的内存空间是在一起的,如果你不告诉他们的类型,我们的确是不知道变量a有几个字节,变量b有几个字节。

那么哪里保存了 变量a,b的类型了?  查资料发现,text代码段中调用a的汇编代码,是会告诉我们变量a的类型的,这样我们就知道读取哪几个字节的值了。 程序运行起来后,BSS段中变量内存数据读取原理类似。