预处理、编译、链接和目标文件的格式
可执行程序是怎么得来的
以C语言为例,c代码经过编译器的预处理,编译成汇编代码,由汇编器编译成目标代码,再链接成可执行文件,由操作系统加载到cpu里来执行。
(截图)
.c----.asm(.s)-----.o(二进制文件)-----A.out(可执行文件)
预处理负责把include的文件包含进来及宏替换等工作
可执行文件是使用共享库的。
静态编译
-static
把库里的东西都放在里面了所以比较大
可执行文件的内部是怎样的?
目标文件的格式ELF
(截图)
文件格式:
- PE是windows下
- ELF是linux下(executable linkable format)
目标文件格式和ABI应用程序二进制接口适应到某一种cpu格式
ELF标准下三种可执行文件:
- 一个可重定位文件(代码和数据)
- 一个可执行文件(用来执行的程序)
-
一个共享文件(代码和数据,连接编译器和动态连接器)
Obeject文件参与程序联接(创建一个程序)和程序执行(运行一个程序)
(截图)
查看ELF文件的头部
gccs readelf -h main
可执行程序加载的主要工作:
映射代码中各种数据对应到进程空间的地址。例如:在文件中的代码段,拷贝到进程的空间时;数据段拷贝到进程空间。
静态链接的ELF可执行文件和进程的地址空间
文件映射进程地址空间
0xc000000开始是用户态可以使用的
0x8048000默认的加载地址
0x8048X00程序的真实入口,可执行文件加载到内存中开始执行的第一行代码 一般静态链接会将所有代码放在一个代码段
-
动态链接的进程会有多个代码段
可执行程序、共享库和动态链接
装载可执行程序之前的工作
可执行程序的的执行环境
-
命令行参数和shell环境
- ls -l/usr/bin列出/usr/bin下的目录信息//ls是一个可执行程序
- shell本身不限制命令行参数的个数,命令行参数的个数受限于命令自身//也就是main函数
- 例如,int main(int argc,char argv[]);//愿意接受命令行参数,用户输入的
-又例如,int main(int argc,char argv[],charenvp[])//envp:shell的环境变量 - shell会调用execve将命令行参数传递给可执行程序的main()函数
-
int execve(int char filename,char argv[],char *const envp[]);//函数原型,先函数调用参数传递,再系统调用参数传递
execve的封装教程
(截图不能用)
命令行参数和环境变量时如何保存和传递的?
(截图不能用)命令行参数和环境变量,fork一个子进程时完全复制父进程的,然后调用execv时,把当前的可执行程序把原来的环境(子进程)给覆盖掉,子进程的用户态堆栈也被清空了,因为新的进程要执行。
那么命令行参数和环境变量时如何进入新程序的堆栈的?
- 命令行参数(char argv[])、环境变量(char const envp[])压栈
- 创建一个新的用户态堆栈,通过指针将命令行参数,环境变量传递给系统调用execve的内核处理函数
-
内核处理函数创建一个新的可执行程序用户态堆栈的同时,将命令行参数和环境变量拷贝进去
shell程序--execve--对应的系统调用sys_execv--然后在初始化时拷贝装载时动态链接和运行时动态链接的应用举例
- 可执行程序装载时动态链接
- 可执行程序运行时动态链接
#### 可执行装载时、运行动态链接- 准备.so文件
共享库文件shlibexample.h和shlibexample.c编译成.so文件
(共享库的代码展示图)
- 分别以共享库和动态加载共享库的方式使用libshlibexample.so文件和libdllibexample.so文件
(展示main函数)
编译main注意这里只提供shlibexample的-L(库对应接口文件所在目录)和-l(库名)并没有提供dllibexample的信息
- 准备.so文件
gcc mian.c -o main -l/path/to/your/dir -lshlibexample -ldl -m32
//分别指定头文件的路径和库文件的路径,动态加载-
export LD_LIBRARY_PATH=$PWD
//将当前目录加入默认路径
./main