gcc编译过程简述

在linux系统上，从源文件到目标文件的转化是由编译器完成的。以hello.c程序的编译为例，如下:

dfcao@linux: gcc -o hello hello.c

在这里，gcc编译器读取源文件hello.c，并把它翻译成一个可执行文件 hello。

这个翻译过程可分为四个阶段逐步完成:预处理，编译，汇编，链接，如下图所示。

gcc编译过程简述

逐步做下简单分析:

在未编译前，hello.c 的源代码如下

#include <stdio.h>

int main()

{

  printf("hello, world\n");

}

第一步、预处理阶段

执行命令: gcc -o hello.i -E hello.c

　　　　或者 cpp -o hello.i hello.c (这里cpp不是值c plus plus,而是预处理器the C Preprocessor)

预处理器cpp根据以字符开头#开头的命令，修改原始C程序。比如hello.c中的第一行为 #include <stdio.h>，预处理器便将stdio.h的内容直接插入到程序中。

预处理之后得到文本文件hello.i，打开如下

#  "hello.c"

#  "<built-in>"

#  "<命令行>"

#  "hello.c"

#  "/usr/include/stdio.h"

...

...

...

extern void funlockfile (FILE *__stream) __attribute__ ((__nothrow__ , __leaf__));

#  "/usr/include/stdio.h"  

#  "hello.c" 

int main()

{

  printf("hello, world\n");

}

在源代码的前面插入了stdio.h，整个hello.i 的行数由hello.c的6行变到了855行！

第二步、编译阶段

执行命令: gcc -o hello.s -S hello.i

　　　　或者 ccl -o hello.s hello.i

编译器ccl 将文本文件hello.i 翻译为hello.s，这个文件里面包含一个汇编程序，如下

    .file    "hello.c"

    .section    .rodata

.LC0:

    .string    "hello, world"

    .text

    .globl    main

    .type    main, @function

main:

.LFB0:

    .cfi_startproc

    pushl    %ebp

    .cfi_def_cfa_offset

    .cfi_offset , -

    movl    %esp, %ebp

    .cfi_def_cfa_register

    andl    $-, %esp

    subl    $, %esp

    movl    $.LC0, (%esp)

    call    puts

    leave

    .cfi_restore

    .cfi_def_cfa ,

    ret

    .cfi_endproc

.LFE0:

    .size    main, .-main

    .ident    "GCC: (Ubuntu/Linaro 4.6.3-1ubuntu5) 4.6.3"

    .section    .note.GNU-stack,"",@progbits

汇编语言是非常有用的，因为它将不同高级语言的不同编译器提供了通用的输出语言。例如，C和Fortran 的在此步编译产生的输出文件都是一样的汇编语言。

第三步、汇编阶段

执行命令: gcc -o hello.o -c hello.s

　　　　或者 as -o hello.o hello.s

汇编器as 将hello.s 翻译成机器语言保存在hello.o 中。这是个二进制文件，用命令hexdump hello.o 打开如下

 457f 464c      

 011c

 000d 000a  83e5 f0e4 ec83 c710

   fce8 ffff c9ff 00c3  6c6c

 2c6f  726f 646c   3a43

  6e75  4c2f 6e69  206f 2e34

 2e36 2d33   746e   2e34

 2e36      7a01

 7c01  0c1b    001c

00000a0 001c       080e

00000b0  0d42  0cc5   2e00

00000c0 746d  2e00    2e00

00000d0    2e00  2e6c

00000e0 2e00   2e00   722e 646f

00000f0   632e 6d6f 656d 746e 2e00 6f6e

  472e 554e 732d  6b63 2e00

 2e6c  665f  656d   

*

   001f     

       001b

       03e8

   000b     

00001a0   004c

第四步、链接阶段

执行命令: gcc -o hello hello.o

　　　　或者 ld -o hello hello.o

注意！hello程序调用了printf 函数，这个函数是标准C库中的一个函数，他保存在一个名为printf.o 的文件中，这个文件必须以某种方式合并到我们的hello.o的程序中。

链接器ld 负责处理这种合并。结果得到hello 可执行文件，可以被加载到内存中由系统执行。

./hello

总结

编译器的编译过程:
源文件－－>预处理－－>编译/优化－－>汇编－－>链接-->可执行文件。

平常用的最多、看起来一句命令就搞定的一次编译背后其实非常不简单。此博作简单记录，能力到了之后再做深入分析。

#---------------------------------------------------------------------------------#

参考文献

《Computer Systems: A Programmer's Perspective》 by Randal Bryant.

“编译过程” by itwilliamlee, http://www.lisdn.com/html/95/n-15195.html

秒客网

gcc编译过程简述

相关文章