windows和linux运行程序的区别

时间:2024-04-02 13:59:49
  • 本文摘自牛客:https://www.nowcoder.com/discuss/224797?type=post&order=time&pos=&page=0
    为什么同一个程序,在同一台计算机上,在Linux下可以运行,而在Windows下却不行呢?
    反过来,Windows上的程序在Linux上也是一样不能执行的

1编译、链接和装载:拆解程序执行

一个程序执行的过程是什么样的?
如果简单说,就是编译器将代码编译成汇编代码,然后汇编代码再通过汇编器变成机器码,这样cpu就可以执行这些机器码了。
上面的过程简化了很多,如果详细分析,要分为两个部分:

  • 第一部分编译、汇编、链接的过程,生成一个可执行文件
  • 第二部分通过装载器把可以执行文件装载到内存中,cpu从内存中读取指令和数据,就真正执行了程序。
    windows和linux运行程序的区别

2 ELF格式和链接

程序最终是通过装载器变成指令和数据的,所以其实生成的可执行代码也并不仅仅是一条条的指令。

在Linux下,可执行文件和目标文件所使用的都是一种叫ELF(Execuatable and Linkable File Format)的文件格式,中文名字叫可执行与可链接文件格式
这里面不仅存放了编译成的汇编指令,还保留了很多别的数据。

ELF文件格式把各种信息,分成一个一个的Section保存起来。ELF有一个基本的文件头(File Header),用来表示这个文件的基本属性,比如是否是可执行文件,对应的CPU、操作系统等等。除了这些基本属性之外,大部分程序还有这么一些Section:

  • 首先是.text Section,也叫作代码段或者指令段(Code Section),用来保存程序的代码和指令;
  • 接着是.data Section,也叫作数据段(Data Section),用来保存程序里面设置好的初始化数据信息;
  • 然后就是.rel.text Secion,叫作重定位表(Relocation Table)。重定位表里,保留的是当前的文件里面,哪些跳转地址其实是我们不知道的。比如上面的 link_example.o 里面,我们在main函数里面调用了 add 和 printf 这两个函数,但是在链接发生之前,我们并不知道该跳转到哪里,这些信息就会存储在重定位表里;
  • 最后是.symtab Section,叫作符号表(Symbol Table)。符号表保留了我们所说的当前文件里面定义的函数名称和对应地址的地址簿。
    链接器会扫描所有输入的目标文件,然后把所有符号表里的信息收集起来,构成一个全局的符号表。然后再根据重定位表,把所有不确定要跳转地址的代码,根据符号表里面存储的地址,进行一次修正。最后,把所有的目标文件的对应段进行一次合并,变成了最终的可执行代码。这也是为什么,可执行文件里面的函数调用的地址都是正确的

3 总结

为什么同样一个程序,在Linux下可以执行而在Windows下不能执行了。其中一个非常重要的原因就是,两个操作系统下可执行文件的格式不一样。

我们今天讲的是Linux下的ELF文件格式,而Windows的可执行文件格式是一种叫作PE(Portable Executable Format)的文件格式。Linux下的装载器只能解析ELF格式而不能解析PE格式。

相关文章