C代码编译成可执行程序的过程

时间:2023-03-08 18:03:27

C代码通过编译器编译成可执行代码,经历了四个阶段,依次为:预处理、编译、汇编、链接。

接下来详细讲解各个阶段

一、预处理

1、任务:进行宏定义展开、头文件展开、条件编译,不检查语法。

2、命令:gcc -E [源文件]  -o [预处理文件]

3、案例:用gcc编译器预处理demo1.c代码,预处理后的文本放到demo1.i中。(gcc -E demo1.c -o demo1.i)

demo1.c代码如下:

 #include <stdio.h>

 #define add(a, b) (a + b)
#define sub(a, b) (a - b) int main(void)
{
int a, b, c, d;
#ifndef __cplusplus
a = b = c = d = ;
#else
a = b = c = d = ;
#endif
printf("num = %d\n", sub(add(a, b), add(c, d)));
return ;
}

demo1.c

生成的demo1.i代码如下:

 #  "demo.c"
# "<command-line>"
# "/usr/include/stdc-predef.h"
# "<command-line>" 此处省略800行... extern void funlockfile (FILE *__stream) __attribute__ ((__nothrow__ , __leaf__));
# "/usr/include/stdio.h" # "demo.c" int main(void)
{
int a, b, c, d; a = b = c = d = ; printf("num = %d\n", ((a + b) - (c + d)));
return ;
}

demo1.i

通过案例可以发现:#define宏定义、stdio.h头文件、#ifdef条件编译都被替换了,并且你还可以故意写一句有语法错误的代码,但是却不会报错。由于stdio.h头文件长达800多行,因此在demo1.i中只截取开头和结尾的几行。

    

二、编译

1、任务:检查语法,将预处理过的文件编译生成汇编文件。

2、命令:gcc -S [源文件] -o [汇编文件]

3、案例;用gcc编译器编译demo2.c代码,编译后的汇编代码放到demo2.s中。(gcc -S demo2.c  -o demo2.s)

demo2.c代码如下:

 #include <stdio.h>

 int main(int argc, char *argv[])
{
printf("hello world\n");
return ;
}

demo2.c

生成的demo2.s代码如下:

     .file    "demo2.c"
.section .rodata
.LC0:
.string "hello world"
.text
.globl main
.type main, @function
main:
.LFB0:
.cfi_startproc
pushq %rbp
.cfi_def_cfa_offset
.cfi_offset , -
movq %rsp, %rbp
.cfi_def_cfa_register
subq $, %rsp
movl %edi, -(%rbp)
movq %rsi, -(%rbp)
movl $.LC0, %edi
call puts
movl $, %eax
leave
.cfi_def_cfa ,
ret
.cfi_endproc
.LFE0:
.size main, .-main
.ident "GCC: (Ubuntu 4.8.2-19ubuntu1) 4.8.2"
.section .note.GNU-stack,"",@progbits

demo.s

通过案例可以看出,我们写的c代码被编译成了汇编代码。故意写错一个语法点,编译器将报错。

三、汇编

1、任务:将汇编文件生成目标文件(2进制文件)。

2、命令:gcc -s [源文件] -o [目标文件]

3、案例:用gcc编译器汇编demo3.c代码,编译后的二进制代码放到demo3.o中。(gcc -c demo3.c  -o demo3.o)

demo3.c代码如下:

 #include <stdio.h>

 int main(int argc, char *argv[])
{
printf("hello world\n");
return ;
}

demo3.c

生成的demo3.o代码如下:

C代码编译成可执行程序的过程

通过汇编阶段,文本代码变成了二进制代码,也就是计算机可以识别的代码。c语言中,二进制代码文件是以.o为后缀名的。

四、链接

1、任务:找到依赖的库文件,将目标文件链接为可执行程序。

2、命令:gcc -c [目标文件] -o [可执行程序] -l[动态库名]

3、案例:通过gcc编译器让demo4链接自己制作的libadd.so动态库,并把demo4编译成可执行程序。gcc demo4.c -o demo4 -L./ -ladd

demo4.c代码如下:

 #include <stdio.h>
#include "add.h" int main(int argc, char *argv[])
{
printf("add = %d\n", add(, ));
return ;
}

demo4.c

通过file命令查看可执行程序的信息:

C代码编译成可执行程序的过程

运行结果:add = 2

还可以通过“size [可执行程序]”命令,来查看程序的text段、data段、bss段的大小。

C代码编译成可执行程序的过程

在程序还没运行前,我们是可以确定它的text段、data段、bss段的大小。