C语言编译器 cc 编译原理

时间:2022-02-11 04:34:16

生成一个可执行的文件通常需要经过以下几个步骤:

  1. 预处理你的源代码,去掉注释,以及其他技巧性的工作就像在 C 中展开宏。

  2. 检查代码的语法看你是否遵守了这个语言的规则。如果没有,编译器会给出 警告。

  3. 把源代码转换为汇编语言 ── 和机器代码很相似, 但是在一定情况下我们仍然可以理解。 [1]

  4. 把汇编语言转换为机器语言──是的,我们在说位元和字节,就是1和0。

  5. 检查你是否准确地使用了函数和全局变量类似的东西。例如,如果你调用了一个不存在的函数,编译器就会给出警告。

  6. 如果你是从多个源代码文件编译,就要学会如何把这些文件组合到一起。

  7. 把产生出来的东西用系统的运行装载器装入内存并运行。

  8. 最后,把可执行文件写入文件系统。

编译 这个词的意思通常指 1 到 4 步──其他的 步骤叫做 连接。有时侯第一步叫做 预处理 。第三和第四步叫做 汇编

  幸运的是,几乎所有这些细节都是隐藏的,因为 cc 只是一个前端。它根据正确的参数调用程序来处理代码。只要输入

%

 

cc foobar.c

就会把 foobar.c 通过以上的步骤编译出来。如果你有多个文件要编译,只要输入

%

 

cc foo.c bar.c

注意,语法检查就是──纯粹的检查语法。而不会检测你可能犯的任何逻辑错误。比如无限循环,或者是你想用一元排序却使用了冒泡排序。 [2]

cc 有很多选项,在帮助手册中都可以找到。这里列出了一些最重要的选项,并且有例子。

-o filename 

输出的文件名。如果你不使用这个选项,cc为产生 出一个叫 a.out 的执行文件。 [3]

%   cc foobar.c 可执行文件是    a.out   %   cc -o foobar foobar.c 可执行文件是    foobar 
-c 

仅仅编译文件,不会连接。如果你只想检查你写的测试程序的语法的话,这个选项非常有用。或者你会使用 Makefile

%   cc -c foobar.c   

这会产生一个 目标文件 (不可执行) 叫做 foobar.o。这个文件可以和其他的目标文件连接在一起构成一个可执行文件。

-g 

产生一个可调试的可执行文件。编译器会在可执行文件中植入一些信息,这些信息能够把源文件中的行数和被调用的函数联系起来。在你一步一步调试程序的时候,调试器能够使用这些信息来显示源代码。这是 非常 有用的;缺点就是被植入的信息让程序变得更大。通常情况下,开 发一个程序的时候我们经常使用 -g,但是我们在编译一个 “release 版本” 的程序的时候,如果程序工作得让人满意了,我 们就不使用 -g 编译。

%   cc -g foobar.c   

这会产生一个可调试版本的程序。 [4]

-O 

产生一个优化版本的可执行文件。编译器会使用一些聪明的技巧产生出比普通编译产生的文件执行更快的可执行文件。可以在 -O 加上数字来使用更高级的优化。但是这样做经常会暴露出编译器的优化器中的一些 错误。例如,2.1.0 版本的 FreeBSD 中的 cc 在某些情况 下使用了 -O2 的话,会产生出错误的代码。

优化通常只在编译一个 release 版本的时候才被打开。

%   cc -O -o foobar foobar.c   

这会产生一个优化版本的 foobar

-O和 -O1指定1级优化

-O2 指定2级优化

-O3 指定3级优化

-O0指定不优化

$cc -c O3 -O0 hello.c

当出现多个优化时,以最后一个为准!!

-I 

可指定查找include文件的其他位置.例如,如果有些include文件位于比较特殊的地方,比如/usr/local/include,就可以增加此选项如下:

$cc -c -I/usr/local/include -I/opt/include hello.c

此时目录搜索会按给出的次序进行.

 

   -E 

这个选项是相对标准的,它允许修改命令行以使编译程序把预先处理的C文件发到标准输出,而不实际编译代码.在查看C预处理伪指令和C宏时,这是很有用的.可能的编译输出可重新定向到一个文件,然后用编辑程序来分析:

 

$cc -c -E hello.c >cpp.out

此命令使include文件和程序被预先处理并重定向到文件cpp.out.以后可以用编辑程序或者分页命令分析这个文件,并确定最终的C语言代码看起来如何.

-D 

允许从编译程序命令行定义宏符号

 

一共有两种情况:一种是用-DMACRO,相当于在程序中使用#define MACRO,另一种是用-DMACRO=A,相当于 
   程序中的#define MACRO A.如对下面这代码: 

#ifdefine DEBUG

printf("debug message\n");

#endif

编译时可加上-DDEBUG参数,执行程序则打印出编译信息

下面的三个参数会迫使 cc 检查你的代码是否符合一些国际标准,经常被我们叫做 ANSI 标准,虽然严格的来说它是一个 ISO 标准。

-Wall 

打开所有 cc 的作者认为值得注意的警告。不要只看这个选项的名字,它并没有打开所有 cc 能够注意到的所有警告。

-ansi 

关闭大多数,但并不是所有,cc 提供的非 ANSI C 特性。不要只看选项的名字,它并不严格保证你的代码会兼容标准。

-pedantic 

关闭 所有 cc 的非 ANSI C 特性。

没有这些选项,cc 能允许你按照标准使用一些非标准的扩展。有一些扩展非常有用,但不能与其他编译器兼容──实际上,这个标准的主要目的之一就是允许我们写出可以在任何系统上的由任何编译器编译的代码。这就叫做 可移植代码

通常来说,你应该让你的代码尽可能的可以移植。否则你就不得不完全重写你的代码以便能够在其他地方运行之──而且谁知道几年后你是否还会用它?