回想初学编程的时候,大部分人都是从C语言开始学起的,除了一些常见的语法和思想,一些基础知识常常被人们忽略,如果没有及时地进行梳理,可能短时间内没有太大的影响,但是在日后碰到这些问题时仍旧一头雾水。例如C语言是一门编译型语言,编译型语言首先将源代码编译生成机器语言,再由机器运行机器码(二进制)。对于编译型语言,绕不过的就是编译器。
下面提出几个问题,不妨思考一下:
- 什么是GNU
- 什么是GCC / G++
- 什么是MinGW-w64
- C++ 标准有哪些?主要区别是什么?
- Makefile是什么?cmake是什么?
如果脑海中没有一个整体的概念框架的话,正如那张图,一个全副武装的骑士,虽然防护的很好,但是对于编译器的基础知识掌握的不牢,就像头盔上的一个缝隙,可能下一箭正中缝隙,败下阵来。
下面具体介绍这几个概念:
什么是GNU
GNU 是一个计划或者叫运动。在这个旗帜下成立了 FSF,起草了 GPL 等。
GNU操作系统是一种由*软件构成的类 Unix 操作系统,该系统基于 Linux 内核,目标在于建立一个完全相容于UNIX的*软件环境。
当时Unix 系统开始收费和商业闭源了。针对这一现象,Richard Stallman发起了 GNU 计划,模仿 Unix 的界面和使用方式,从头做一个开源的版本。他自己做了编辑器 Emacs 和编译器 GCC。接下来开发者实现了包括核心的 gcc 和 glibc。但是 GNU 系统缺少操作系统内核。原定的内核叫 HURD,一直完不成。同时 BSD(一种 UNIX 发行版)陷入版权纠纷,x86 平台开发暂停。这时 Linus 为了在 PC 上运行 Unix,在 Minix 的启发下,开发了Linux。当然 Linux 只是一个系统内核,系统启动之后使用的仍然是 gcc 和 bash 等软件。Linus 在发布 Linux 的时候选择了 GPL,因此符合 GNU 的宗旨。也弥补了GNU在这方面的缺少,于是合在一起打包发布叫 GNU / Linux。然后省掉了前面部分,变成了 Linux 系统。实际上 Debian,RedHat 等 Linux 发行版中内核只占了很小一部分容量。
参考:https://www.gnu.org/gnu/gnu-linux-faq.html
什么是GCC / G++
GCC(GNU编译器套件):GNU Compiler Collection。可以编译C、C++、JAVA、Fortran、Pascal、Object-C、Ada等语言。
gcc / g++
gcc是GCC中的GNU C Compiler(C 编译器)
g++是GCC中的GNU C++ Compiler(C++编译器)
编译的四个阶段
在具体的编译过程中,主要分为四个阶段:
- cpp(预处理器):c语言pre-proccessor。头文件展开,宏替换,注释去掉。hello.c变成hello.i
- ccl(编译器):c语言compile。C文件变成汇编文件:hello.i变成hello.s
- as(汇编器):assembler。汇编文件变成可执行的二进制文件:hello.s变成hello.o
- ld(链接器):GNU Linker,loader。将函数库中相应的代码组合到目标文件中,汇编文件和系统库文件链接起来,生成在特定平台可执行的程序。
最早的操作系统中,是没有链接器的,由加载器loader进行工作,所以ld的命名由此而来。
gcc调用了C compiler,而g++调用了C++ compiler
gcc和g++的主要区别
- 对于 .c和.cpp文件,gcc分别当做c和cpp文件编译(c和cpp的语法强度是不一样的)
- 对于 .c和.cpp文件,g++则统一当做cpp文件编译
- 使用g++编译文件时,g++会自动链接标准库STL,而gcc不会自动链接STL
- gcc在编译C文件时,可使用的预定义宏是比较少的
- gcc在编译cpp文件时/g++在编译c文件和cpp文件时(这时候gcc和g++调用的都是cpp文件的编译器),会加入一些额外的宏。
- 在用gcc编译c++文件时,为了能够使用STL,需要加参数 –lstdc++ ,但这并不代表 gcc –lstdc++ 和 g++等价,它们的区别不仅仅是这个
这里强推《深入理解计算机系统》,CSAPP这本书上讲解的非常详细。
MinGW-w64
MinGW 的全称是:Minimalist GNU on Windows 。它实际上是将经典的开源 C语言 编译器 GCC 移植到了 Windows 平台下,并且包含了 Win32API ,因此可以将源代码编译为可在 Windows 中运行的可执行程序。简单来说,MinGW 就是 GCC 的 Windows 版本。
MinGW-w64 与 MinGW 的区别在于 MinGW 只能编译生成32位可执行程序,而 MinGW-w64 则可以编译生成 64位 或 32位 可执行程序。目前,MinGW 现已被 MinGW-w64 所取代,且 MinGW 也早已停止了更新。
MinGW-w64 是开源软件,可以免费使用。使用 Windows 的C语言运行库,因此编译出的程序不需要第三方 DLL ,可以直接在 Windows 下运行。 那些著名的开源 IDE 实际只是将 MinGW-w64 封装了起来,使它拥有友好的图形化界面,简化了操作,但内部核心仍然是 MinGW-w64。
C++语言版本
C++是一门以C为基础发展而来的一门面向对象的高级程序设计语言,从1983年由Bjarne Stroustrup教授在贝尔实验室创立开始至今,已有30多个年头。C++从最初的C with class,经历了从C++98、C++ 03、C++ 11、C++ 14、C++17再到C++ 20多次标准化改造,功能得到了极大的丰富,已经演变为一门集面向过程、面向对象、函数式、泛型和元编程等多种编程范式的复杂编程语言。
年份 |
C++ 标准名称 |
非正式名称 |
1998 |
ISO/IEC 14882:1998 |
C++98 |
2003 |
ISO/IEC 14882:2003 |
C++03 |
2011 |
ISO/IEC 14882:2011 |
C++11 |
2014 |
ISO/IEC 14882:2014 |
C++14 |
2017 |
ISO/IEC 14882:2017 |
C++17 |
2020 |
ISO/IEC 14882:2020 |
C++20 |
C++ 98
C++从最初的C with Classes新增了很多其他的特性,比如异常处理、模板、标准模板库(STL)、运行时异常处理(RTTI)与名字空间(Namespace)等。C++ 03 通常被认为是98的补丁。
C++ 11
C++引入了对象移动、右值引用、lamba表达式(函数式编程)、编译时类型识别(auto)、别名模板以及很多新型关键词(如nullptr、decltype、constexpr)等现代编程语言常具备的能力,让C++与时俱进,开发效率得到了很大的提升。这些新的特性随着C++11标准的发布而被正式确立下来。C++ 11版本也被称为现代C++,而C++ 98/03版本也被称为传统C++。此外还有long long的基本类型。新增容器std::unordered_map/std::unordered_multimap、std::unordered_set/std::unordered_multiset 等。
C++ 14
C++14引入了二进制文字常量、将类型推导从Lambda函数扩展到所有函数、变量模板以及数字分位符等。进一步补充优化C++11。
C++ 17
到了2017年,C++迎来了C++17标准。此次对C++的改进和扩增,让C++变得更加容易接受和便于使用了。C++17引入了许多新的特性,比如类模板参数推导、UTF-8文字常量、fold表达式、新类型以及新的库函数等。
C++ 20
C++20 的 Big Four(四大新特性:概念、范围、协程和模块)以及核心语言(包括一些新的运算符和指示符)。
Makefile
一个工程中的源文件不计其数,其按类型、功能、模块分别放在若干个目录中,makefile定义了一系列的规则来指定哪些文件需要先编译,哪些文件需要后编译,哪些文件需要重新编译,甚至于进行更复杂的功能操作,因为 makefile就像一个Shell脚本一样,也可以执行操作系统的命令。
make是一个命令工具,它解释Makefile 中的指令。在Makefile文件中描述了整个工程所有文件的编译顺序、编译规则。Makefile 有自己的书写格式、关键字、函数。像C 语言有自己的格式、关键字和函数一样。而且在Makefile 中可以使用系统shell所提供的任何命令来完成想要的工作。Makefile在绝大多数的IDE 开发环境中都在使用,譬如 Visual C++的 nmake、linux 下的 GNU make、Qt 的 qmake 等等。
cmake
不同的IDE所集成的make工具所遵循的规范和标准都不同,也就导致其语法、格式不同,也就不能很好的跨平台编译,会使得工作繁琐。那么cmake为了解决这个问题而诞生了,其允许开发者指定整个工程的编译流程,在根据编译平台,生成本地化的Makefile和工程文件,最后用户只需make编译即可。简而言之,可以把cmake看成一款自动生成 Makefile 的工具,所以编译流程就变成了:cmake—>make–>用户代码–>可执行文件