通过一个小例子来简单理解C语言中的内存空间管理

时间:2022-05-14 19:35:16

对于一个C语言程序而言,内存空间主要由五个部分组成代码段(.text)、数据段(.data)、BSS段(.bss),堆和栈组成,其中代码段,数据段和BSS段是编译的时候由编译器分配的,而堆和 栈是程序运行的时候由系统分配的。布局如下

通过一个小例子来简单理解C语言中的内存空间管理

在上图中,由编译器分配的地址空间都是在连接的时候分配的,而运行时分配的空间是在程序运行时由系统分配的

BSS段:BSS段(bss segment)通常是指用来存放程序中未初始化的全局变量和静态变量 (这里注意一个问题:一般的书上都会说全局变量和静态变量是会自动初始化的,那么哪来的未初始化的变量呢?变量的初始化可以分为显示初始化和隐式初始化,全局变量和静态变量如果程序员自己不初始化的话的确也会被初始化,那就是不管什么类型都初始化为0,这种没有显示初始化的就是我们这里所说的未初始化。既然都是0那么就没必要把每个0都存储起来,从而节省磁盘空间,这是BSS的主要作用)的一块内存区域。BSS是英文Block Started by Symbol的简称。BSS段属于静态内存分配。 BSS节不包含任何数据,只是简单的维护开始和结束的地址,即总大小,以便内存区能在运行时分配并被有效地清零。BSS节在应用程序的二进制映象文件中并不存在,即不占用磁盘空间 而只在运行的时候占用内存空间 ,所以如果全局变量和静态变量未初始化那么其可执行文件要小很多。
 
数据段:数据段(data segment)通常是指用来存放程序中已初始化的全局变量和静态变量的一块内存区域。数据段属于静态内存分配,可以分为只读数据段和读写数据段。 字符串常量等,但一般都是放在只读数据段中 。
 
代码段:代码段(code segment/text segment)通常是指用来存放程序执行代码的一块内存区域。这部分区域的大小在程序运行前就已经确定,并且内存区域通常属于只读, 某些架构也允许代码段为可写,即允许修改程序。在代码段中,也有可能包含一些只读的常数变量,例如字符串常量等,但一般都是放在只读数据段中 。
 
堆(heap):堆是用于存放进程运行中被动态分配的内存段,它的大小并不固定,可动态扩张或缩减。当进程调用malloc等函数分配内存时,新分配的内存就被动态添加到堆上(堆被扩张);当利用free等函数释放内存时,被释放的内存从堆中被剔除(堆被缩减)
 
栈 (stack):栈又称堆栈, 是用户存放程序临时创建的局部变量,也就是说我们函数括弧“{}”中定义的变量(但不包括static声明的变量,static意味着在数据段中存放变 量)。除此以外,在函数被调用时,其参数也会被压入发起调用的进程栈中,并且待到调用结束后,函数的返回值也会被存放回栈中。由于栈的先进先出特点,所以 栈特别方便用来保存/恢复调用现场。从这个意义上讲,我们可以把堆栈看成一个寄存、交换临时数据的内存区。注意:栈空间是向下增长的,每个线程有一个自己的栈,在linux上默认的大小是8M,可以用ulimit查看和修改。

栈系统提供的功能,特点是快速高效,缺点是有限制,数据不灵活;而堆是函数库提供的功能,特点是灵活方便,数据适应面广泛,但是效率有一定降低。

 

以下是一个简单的c文件,环境是OS--Linux,ARCH--PPC

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
##sta.c###
#include <stdio.h>
 
int kk[100] = {1,2,3,4,5};
int tt[100];
int ii;
 
int main()
{
int i;
static int si;
char a[10]= "abcd";
printf("i is %d/n");
return 0;
}
 
 
 
经过gcc -S sta.c之后,生成的汇编代码如下
 
##sta.s###
 
 
 
    .file  "sta.c"
    .gnu_attribute 4, 2
    .gnu_attribute 8, 3
    .globl kk
    .section    ".data"
    .align 2
    .type  kk, @object
    .size  kk, 400
kk:
    .long  1
    .long  2
    .long  3
    .long  4
    .long  5
    .zero  380
    .lcomm si.2254,4,4
    .type  si.2254, @object
    .section    .rodata
    .align 2
.LC1:
    .string "i is %d/n"
    .align 2
.LC0:
    .string "abcd"
    .zero  5
    .section    ".text"
    .align 2
    .globl main
    .type  main, @function
 
main:
    stwu 1,-32(1)
    mflr 0
    stw 0,36(1)
    stw 31,28(1)
    mr 31,1
    lis 9,.LC0@ha
    la 9,.LC0@l(9)
    lwz 0,0(9)
    lbz 9,4(9)
    stw 0,12(31)
    stb 9,16(31)
    li 0,0
    stb 0,17(31)
    li 0,0
    stb 0,18(31)
    li 0,0
    stb 0,19(31)
    li 0,0
    stb 0,20(31)
    li 0,0
    stb 0,21(31)
    lis 9,.LC1@ha
    la 3,.LC1@l(9)
    crxor 6,6,6
    bl printf
    li 0,0
    mr 3,0
    lwz 11,0(1)
    lwz 0,4(11)
    mtlr 0
    lwz 31,-4(11)
    mr 1,11
    blr
    .size  main, .-main
    .comm  tt,400,4
    .comm  ii,4,4
    .ident "GCC: (GNU) 4.2.3"
    .section    .note.GNU-stack,"",@progbits

 

Note: 一般编译器和操作系统实现来说,对于虚拟地址空间的最低(从0开始的几K)的一段空间是未被映射的,也就是说它在进程空间中,但没有赋予物理地址,不能被访问。这也就是对空指针的访问会导致crash的原因 ,因为空指针的地址是0。至于为什么预留的不是一个字节而是几K,是因为内存是分页的,至少要一页;另外几k的空间还可以用来捕捉使用空指针的情况。