在Linux下,当我们使用GCC来编译Hello World程序时,只须使用最简单的命令(源代码为hello.c)
gcc hello.c
./a.out
事实上,上述过程可以分解为4个步骤,分别是预处理,编译,汇编和链接,如下图:
预编译
预编译阶段把.cpp和.h等文件编译成一个 .i文件,第一步预编译的过程相当于如下命令:
gcc -E hello.c -o hello.i #-E表示只进行预编译,-o指定生成文件名
预编译阶段主要处理那些源代码文件中以“#”开始的预编译指令。比如“#include”、“#define”等,主要处理规则如下:
- 将所有的#define删除,并且展开所有的宏定义
- 处理所有的预编译指令,比如 #if、#ifdef、#elif、#else、#endif
- 处理#include预编译指令,将包含的文件插入到该预编译指令的位置。(这个过程是递归进行的,也就是说被包含的文件可能还包含其他文件)
- 删除所有的注释“//”和“/* */”
- 添加行号和文件名标识,以便于编译时编译器产生调试用的行号信息及用于编译时产生编译错误或警告能够显示行号
- 保留所有的#pragram编译器指令,因为编译器要使用它们
经过预编译后的.i文件不包含任何宏定义,因为所有的宏已经被展开,并且包含的文件也以经插入到.i文件中,所有可以通过查看.i文件来判断宏定义是否正确或头文件是否包含正确
预编译阶段处理其实可以总结为以下三点:
- 处理预编译指令
- 删除注释
- 宏替换
hello.c文件与预编译生成的hello.i文件内容对比如下
编译
编译过程就是把预处理完的文件进行一系列词法分析、语法分析、语义分析及优化后生成的汇编代码文件,这个过程是程序构建的核心部分,命令:
gcc -S hello.i -o hello.s
hello.c文件与编译生成的hello.s文件内容对比如下
汇编
汇编过程把汇编代码转成机器可执行的指令
gcc -c hello.s -o hello.o
该过程的处理有:翻译成二进制,生成各个段、生成符号表
汇编生成的hello.o文件是二进制文件,用vim查看会是乱码,要使用objdump命令查看
objdump -h hello.o
链接
链接阶段的处理有:合并各个段,符号解析、符号重定位