题目
分析程序,在运行前思考:这个程序是否能够正确返回?
运行之后再思考:为什么是这种结果?
通过这个程序加深对相关内容的理解。
贴入代码如下:
assueme cs:codesg
codesg segment
mov ax,4c00h
int 21h
start: mov ax,0
s: nop
nop
mov di,offset s
mov si,offset s2
mov ax,cs:[si]
mov cs:[di],ax
s0: jmp short s
s1: mov ax,0
int 21h
mov ax,0
s2: jmp short s1
nop
codesg ends
end start
分析
由我们之前学到的知识,我们知道这个程序从start标号的字段开始执行。
我们先来看一下程序的执行流程:
1. start: mov ax,0
2. s: nop ; nop标号语句,在运行时在代码段中分配一个字节的空间,
3. nop ; 这个字节(空间)的值为90h。
; 操作符 `offset` 的功能是取得标号的偏移地址。
4. mov di,offset s ; 将 s 的偏移地址存到 di 寄存器中
5. mov si,offset s2 ; 将 s2 的偏移地址存到 si 寄存器中
6. mov ax,cs:[si] ; 此行是将cs:[si]内存中的机器码存到ax寄存器中,
; 这个机器码是由编译器将 s2 标号字段中的指令编译而成。
7. mov cs:[di],ax ; 将 ax 中的 s2 标号字段的机器码存放到 s 标号字段中。
8. s0: jmp short s ; 跳转到 s 标号字段处执行代码。
9. s: jmp short s1 ; 根据我们之前的分析, 指令是用相对偏移来表示的
; 因此执行的操作并不是真的跳转到 s1 这个标号,
; 而是跳转编译时确定的 该指令到 s1 标号的偏移量。
; 所以我们要分析接下来程序的流程的话 , 就必须先编译程序 ,
; 通过查看这条指令的机器代码,才知道偏移量是多少。
; 然后再根据这个偏移量确定程序下一步应该执行哪里的指令。
; 根据下图的编译结果 , 可以发现 ,
; jmp short s1 在编译后得到的指令是 : EB F6
; 由上可知,偏移量是 :F6
; 偏移量是由 补码 来表示的,由书中 附注二 ,
; 我们可以算出 F6对应的有符号十进制数为 -10。
; 从这里,我们可以知道,这条指令是将 ip 的值加上 -10。
; 那么,我们再看看 ip - 10 指向的地址是哪里呢 ?
; 由下图的编译结果,我们可以知道,
; 它指向的刚好就是 code segment 开始的位置.
10. mov ax,4c00h
11. int 21h ;看到这两句,大家就知道,程序是可以正常返回了
反编译
注意这里使用 debug 的
u
命令进行反汇编的时候要指定代码段的偏移地址为 0 ,否则 debug 会自动从 start 标号的地方开始反汇编
有时候单纯从
u 0
命令无法查看到jmp short s1
这条代码。因为有的命令行工具可能不能够显示过多的代码。 我们可以从上图中找一个参照点,再次运用u
命令,就可以看到这行代码了。从下图中,我们可以看到,jmp short s1对应的机器代码,正是EB F6
- jmp short s1的跳转原理分析:
1. codesg segment
mov ax,4c00h ; 3字节
int 21h ; 2字节
2. start: mov ax,0 ; 3字节
3. s: jmp short s1 ; 2字节
; 上述4条指令总共加起来是10字节,即 10 个单位的偏移量!
; 由于 nop 只占一个字节 , 因此
; 原来 s 中的两个 nop 被jmp short s1完全替代。
; CPU首先读取这条指令到指令缓存器里
; 此时的ip为8(由上图可以知道)
; 【文末的参考文章中的len(EB F6)解释错误,应为2,此处已更正】
; 接下来 , (ip) = (ip) + len(EB F6) = (ip) + 2 = 10
; 然后执行这条指令 , 即为 (ip) = (ip) - 10 = 0
; 这样 ip 就回到了 code segment 的起始处
; 这样继续执行
4. mov ax,4c00h
5. int 21h
; 这样,程序就这样神奇的执行成功啦!!!
总结
运用王爽老师在P179页的话,CPU在执行jmp指令的时候并不需要转移的目的地址,而包含的是转移的位移。这个位移,是编译器根据汇编指令中的“标号”计算出来的。
本博参考了他的文章:
链接:https://www.jianshu.com/p/7e5dfea72b65