c编译链接过程

时间:2025-01-22 22:48:02
注:这不会是一篇非常完整的文档,因为我不适合做这样的工作:)如果有相关的问题请跟帖提出,我会选择回答并且日后重新整理成为一份好的   FAQ。

用   C   写一个程序需要些什么工具?某甲:“编译器,VC   啦   TC   啦什么的……”
是吧?不对:)其实这句话首先不完整,其次有逻辑的错误。我们需要的不仅仅是一个编译器;首先我们需要的是一个书写程序的工具,一般统称“编辑器”。最简单的编辑器就是   Windows   自带的写字板,好一点的有   UltraEdit   或者   EditPlus   之类。在   Linux   下可以使用   VI,   Vim   或者大名鼎鼎的   Emacs   作为编辑器。编辑器的作用在于让你输入程序,并且保存为一个普通的文本文档。因此,如果你能记得在保存的时候选择“存为文本文件(*.txt)”或者类似的命令(以保证得到的文件里面没有杂七杂八的格式信息),用   Microsoft   Word   或者   MacroMeidia   DreamWeaver   MX   也没有问题^_^   C/C++   的源文件名没有   Java   的文件命名机制那么   BT,但是有几个常规如下:
·C   源码文件后缀名为   .c
·C++   源码文件后缀名为   .cpp   .cxx   .cc,或者在区分文件名大小写的系统上为   .C
·C   头文件(表头档——我喜欢这个名字)为   .h
·C++   头文件为   .h   或者   .hpp,而标准库的头文件通常没有后缀名(如   iostream)
所有的这些后缀名都不影响文件本身的内容:所有文件都是   plain   text   ——纯文本文档。后缀名的作用在于提示程序员它所包含的内容,同时可以提示编译器应该采取的行为。
写程序不是写小说。除了编辑器,我们还需要一套工具,把我们写的程序代码转换成机器可以执行的二进制格式。这一套工具应该至少包含一个预处理器,一个编译器和一个链接器。对于   GNU   Binutils/GCC   系列工具,有预处理器   cpp   (C   Pre-Processor),编译器   gcc(GNU   C   Compiler)和   g++   (GNU   C++   Compiler),汇编器   as(The   GNU   assembler)   和链接器   ld(The   GNU   Linker   )。这么多工具,都是干什么的?让我们一个一个瞧瞧看。
·这是一个很经典的   C   程序,传说中的   Hello,   World
gentoo@yuantoo   tmp   $   cat  
#include   <>
int   main()
{
    printf( "Hello,   world!\n ");
}
·编译成    
gentoo@yuantoo   tmp   $   gcc     -o  
·运行
gentoo@yuantoo   tmp   $   ./
Hello,   world!

好,现在看看它到底都做了什么工作。
第二步中,我用   gcc     -o     把     编译成了   。这里其实还有几个步骤,但是   Gcc   自动的完成了它们。这包括预处理、编译和链接。
首先是预处理。我们可以让   gcc   在预处理之后停下:
gentoo@yuantoo   tmp   $   gcc   -E  
结果是,gcc   在屏幕上飞快的打印了无数的看不见的信息。可以看到最后几行是这样的:

extern   char   *ctermid   (char   *__s)   ;
#   807   "/usr/include/ "   3   4
extern   void   flockfile   (FILE   *__stream)   ;


extern   int   ftrylockfile   (FILE   *__stream)   ;


extern   void   funlockfile   (FILE   *__stream)   ;
#   831   "/usr/include/ "   3   4

#   2   " "   2
int   main()
{
    printf( "Hello,   world!\n ");
}

也就是说,我们的     的内容是在最后。而前面的那些东西,都是从   <>   以及     的包含文件中插入进来的信息。预处理器主要的工作就是处理所有源码中以   #   开头的行,将   #include   指令替换成指令指出的文件的内容,对   #define   定义的符号进行了文本替换,以及根据符号选择需要进入结果文件的内容。我们短短四行字的代码文件,经过   gcc   的预处理,得到了一个   913   行的文件。
预处理之后的工作是汇编——这也是真正编译工作的第一步骤。用   -S   标志可以让   gcc   在汇编之后停下来。
gentoo@yuantoo   tmp   $   gcc   -S  
gentoo@yuantoo   tmp   $   ls
   
我们得到了一个名为     的文件。看看它的开始部分
gentoo@yuantoo   tmp   $   head   -n10  
                .file       " "
                .section                 .rodata
.LC0:
                .string   "Hello,   world!\n "
                .text
.globl   main
                .type       main,   @function
main:
                pushl       %ebp
                movl         %esp,   %ebp
熟悉吧!都是生成的汇编码。
生成汇编码之后的步骤是汇编,把汇编码转换成对象文件。

gentoo@yuantoo   tmp   $   as     -o  

得到了   ,就是包含     代码的对象代码。
得到的   hello   还不能运行,我们需要把它和   C   语言运行库链接起来。它不仅包含了程序的入口,还有   printf   等标准   C   库函数的实现。

gentoo@yuantoo   tmp   $   ld   -o     -dynamic-linker   /lib/.2   /usr/lib/crt?.o     -lc

这里,-o     表示输出为     文件。-dynamic-linker   /lib/.2   表示将程序动态链接到   /lib/.2   这个   shared   object。这个   shared   object   作为操作系统中的一个特殊的库,它负责引入其他的   so。同时,我们要在我们的程序中包含   /usr/lib   下的几个   crt?.o   对象文件:它们中包含了   C   程序的所需要的运行时环境。最后一个参数   -lc   表示将程序链接到标准   C   库上(名为   .5,在   /usr/lib   目录下。ld   会根据配置文件自动搜索   /usr/lib   目录;如果库文件在其他目录中,则需要用   -L   参数指出。)执行完毕,我们得到了一个具有执行权限的     文件。

gentoo@yuantoo   tmp   $   ./
Hello,   world!
gentoo@yuantoo   tmp   $

就这样,一个简单的   C   程序文件,经过   0、编写,1、预处理,2、编译,3、链接,终于生成了一个可执行文件。一般而言,gcc   编译器可以替我们完成整个过程,只要简简单单一个   gcc   -o       命令,三个步骤就可以统统完成。

从上面可以看出,编写代码和编译代码完全是分离的两个过程,可以用完全不同的工具替换每个步骤(譬如用   notepad   或者   EditPlus   作编辑器编写代码,用   Cygwin   或者   Mingw   做编译器,等等)。VC   和   TC   都是所谓的   IDE(集成开发环境),它包含了编辑器、编译器和调试器,通常还包含了项目管理和文档生成以及其他一系列辅助工具,可以大大简化项目开发周期。它们既不是编译器,也不是编辑器;它们包含了这些所有东西。

——感谢木棉   BBS   的   pqf   大侠的帮助