Linux 上 C 程序的内存布局

时间:2023-03-08 18:12:43

在仔细研究这个问题之前,我认为 C 程序在内存中只有代码段,堆和栈三部分构成。前几天面试被问到了这个问题,才发现自己的印象是不完全的。

在本文中通过解析析一个 C 程序中变量和函数的地址来分析 C 程序在内存中的布局。

首先简单介绍一下Linux上C程序的内存分布。

Linux 上 C 程序的内存布局

一般情况下从低地址到高地址分布着:

  • 程序代码段及只读数据段
    • 程序代码,以及字符串常量等都存储在这里
  • 可读可写数据段
    • 全局变量,静态变量存储在这里  
  • 数据堆
    • 程序中动态分配的内存在这一块 
  • 共享库
    • 程序加载的共享库加载在这个地方
  • 数据栈
    • 局部变量,函数参数,函数返回地址等存储在这里
  • 内核地址
    • 操作系统内核内存空间

C语言代码如下(var_memory.c)

 #include <stdio.h>
#include <stdlib.h> #include <sys/types.h>
#include <unistd.h>
#include <errno.h>
#include <argp.h> int global = ;
static int static_global = ; int main()
{
char *string_literal = "hello";
static int static_local = ;
char local_array[] = {'a', 'b', 'c'};
int *malloced = (int *)malloc(*sizeof(int)); pid_t pid = getpid();
printf("pid: %ld\n", (long)pid); // string_literaling literal and function in this module are loaded
// into readonly and excutable segment
printf("%.8p: addr of main\n", &main);
printf("%.8p: addr of local string_literal literal\n", string_literal);
puts(""); // static and global variables are allocated in data segment
printf("%.8p: addr of global int\n", &global);
printf("%.8p: addr of global static int\n", &static_global);
printf("%.8p: addr of local static int\n", &static_local);
puts(""); // allocated in heap
printf("%.8p: addr of local malloc\n", malloced);
puts(""); // errno is from a library
printf("%.8p: addr of errno\n", &errno);
puts(""); // printf is from a library
printf("%.8p: addr of printf\n", &printf);
puts(""); printf("%.8p: addr of argp_program_verstatic_localon_hook\n", & argp_program_version_hook);
puts(""); // local variable in stack
printf("%.8p: addr of local pid\n", &pid);
printf("%.8p: addr of local array\n", local_array);
puts(""); scanf("%s", local_array);
return ;
}

在linux命令行

make var_memory.c

生成var_memory可执行文件,运行

./var_memory

输出如下:

 pid:
0x004b26dd: addr of main
0x004b29d0: addr of local string_literal literal 0x004b4008: addr of global int
0x004b400c: addr of global static int
0x004b4010: addr of local static int 0x00d30160: addr of local malloc 0xb7db86b4: addr of errno 0xb7e0b1c0: addr of printf 0xb7f8f798: addr of argp_program_verstatic_localon_hook 0xbf85518c: addr of local pid
0xbf855198: addr of local array

打开另外一个终端窗口,根据上面输出的pid,运行命令

 pmap 4760 # 进程id以上面输出为准

输出如下

 :   ./var_memory
004b2000 4K r-x-- var_memory
004b3000 4K r---- var_memory
004b4000 4K rw--- var_memory
00d30000 136K rw--- [ anon ]
b7db8000 8K rw--- [ anon ]
b7dba000 1852K r-x-- libc-2.26.so
b7f89000 4K ----- libc-2.26.so
b7f8a000 8K r---- libc-2.26.so
b7f8c000 4K rw--- libc-2.26.so
b7f8d000 12K rw--- [ anon ]
b7fbb000 8K rw--- [ anon ]
b7fbd000 12K r---- [ anon ]
b7fc0000 8K r-x-- [ anon ]
b7fc2000 148K r-x-- ld-2.26.so
b7fe7000 4K r---- ld-2.26.so
b7fe8000 4K rw--- ld-2.26.so
bf836000 132K rw--- [ stack ]
total 2352K

从运行C语言程序与pmap的输出可以看出。

  • main函数(0x004b26dd)和字符串常量(0x004b29d0)被分配在了内存区域
    • 004b2000      4K r-x-- var_memory,其中rx代表只读和可执行
  • 全局变量global(0x004b4008),全局静态变量 static_global(0x004b400c),局部静态变量(0x004b4010)被分配在了数据段
    • 004b4000      4K rw--- var_memory,其中rw代表可以读和写
  • 使用malloc分配的空间(0x00d30160)处在堆(heap)里
    • 00d30000    136K rw---   [ anon ]
  • 共享库提供的全局变量errno(0xb7db86b4),被分配在共享库数据段里
    • b7db8000      8K rw---   [ anon ]
  • 共享库提供的函数printf(0xb7e0b1c0),被分配在共享库代码段里
    • b7dba000   1852K r-x-- libc-2.26.so
  • 局部变量(0xbf85518c,0xbf855198)被分配在了栈上
  • bf836000    132K rw---   [ stack ]

希望这篇文章,对同样困惑于C程序在内存中布局的你有所帮助。