2.11 修改CS、IP的指令
在CPU中,程序员能够用指令读写的部件只有寄存器,程序员可以通过改变寄存器中的内容实现对CPU的控制。CPU从何处执行指令是由CS、IP中的内容决定的,程序员可以通过改变CS、IP中的内容来控制CPU执行目标指令。
我们如何改变CS、IP的值呢?显然,8086CPU必须提供相应的指令。我们如何修改AX中的值?可以用mov指令,如mov ax,123将ax中的值设为123,显然,我们也可以用同样的方法设置其他寄存器的值,如mov bx,123,mov cx,123,mov dx,123等。其实,8086CPU大部分寄存器的值,都可以用mov指令来改变,mov指令被称为传送指令。
但是,mov指令不能用于设置CS、IP的值,原因很简单,因为8086CPU没有提供这样的功能。8086CPU为CS、IP提供了另外的指令来改变它们的值。能够改变CS、IP的内容的指令被统称为转移指令(我们以后会深入研究)。我们现在介绍一个最简单的可以修改CS、IP的指令:jmp指令。
若想同时修改CS、IP的内容,可用形如"jmp段地址:偏移地址"的指令完成,如
jmp 2AE3:3,执行后:CS=2AE3H,IP=0003H,CPU将从2AE33H处读取指令。
jmp 3:0B16,执行后:CS=0003H,IP=0B16H,CPU将从00B46H处读取指令。
"jmp 段地址:偏移地址"指令的功能为:用指令中给出的段地址修改CS,偏移地址修改IP。
若想仅修改IP的内容,可用形如"jmp 某一合法寄存器"的指令完成,如
jmp ax, 指令执行前:ax=1000H,CS=2000H,IP=0003H 指令执行后:ax=1000H,CS=2000H,IP=1000H jmp bx, 指令执行前:bx=0B16H,CS=2000H,IP=0003H 指令执行后:bx=0B16H,CS=2000H,IP=0B16H |
"jmp 某一合法寄存器"指令的功能为:用寄存器中的值修改IP。
jmp ax,在含义上好似:mov IP,ax。
注意,我们在适当的时候,会用已知的汇编指令的语法来描述新学的汇编指令的功能。采用一种"用汇编解释汇编"的方法来使读者更好地理解汇编指令的功能,这样做有助于读者进行知识的相互融会。要强调的是,我们是用"已知的汇编指令的语法"进行描述,并不是用"已知的汇编指令"来描述,比如,我们用mov IP,ax来描述jmp ax,并不是说真有mov IP,ax这样的指令,而是用mov指令的语法来说明jmp指令的功能。我们可以用同样的方法描述jmp 3:01B6的功能:jmp 3:01B6 在含义上好似mov CS,3 mov IP,01B6。
问题2.3
内存中存放的机器码和对应的汇编指令情况如图2.27所示,设CPU初始状态:CS=2000H,IP=0000H,请写出指令执行序列。思考后看分析。
图2.27 内存中存放的机器码和对应的汇编指令
分析:
CPU对图2.27中的指令的执行过程如下。
(1) 当前CS=2000H,IP=0000H,则CPU从内存2000H×16+0=20000H处读取指令,读入的指令是:B8 22 66(mov ax,6622H),读入后IP=IP+3=0003H;
(2) 指令执行后,CS=2000H,IP=0003H,则CPU从内存2000H×16+0003H =20003H处读取指令,读入的指令是:EA 03 00 00 10(jmp 1000:0003),读入后IP=IP+5=0008H;
(3) 指令执行后,CS=1000H,IP=0003H,则CPU从内存1000H×16+0003H =10003H处读取指令,读入的指令是:B8 00 00(mov ax,0000),读入后IP=IP+3=0006H;
(4) 指令执行后,CS=1000H,IP=0006H,则CPU从内存1000H×16+0006H =10006H处读取指令,读入的指令是:8B D8(mov bx,ax),读入后IP=IP+2=0008H;
(5) 指令执行后,CS=1000H,IP=0008H,则CPU从内存1000H×16+0008H =10008H处读取指令,读入的指令是:FF E3(jmp bx),读入后IP=IP+2=000AH;
(6) 指令执行后,CS=1000H,IP=0000H,CPU从内存10000H处读取指令……
经分析后,可知指令执行序列为:
(1) mov ax,6622H
(2) jmp 1000:3
(3) mov ax,0000
(4) mov bx,ax
(5) jmp bx
(6) mov ax,0123H
(7) 转到第3步执行
2.12 代码段(1)
前面讲过,对于8086PC机,在编程时,可以根据需要,将一组内存单元定义为一个段。我们可以将长度为N(N≤64KB)的一组代码,存在一组地址连续、起始地址为16的倍数的内存单元中,我们可以认为,这段内存是用来存放代码的,从而定义了一个代码段。比如,将:
mov ax,0000 (B8 00 00) add ax,0123 (05 23 01) mov bx,ax (8B D8) jmp bx (FF E3) |
这段长度为10个字节的指令,存放在123B0H~123B9H的一组内存单元中,我们就可以认为,123B0H~123B9H这段内存是用来存放代码的,是一个代码段,它的段地址为123BH,长度为10个字节。
如何使得代码段中的指令被执行呢?将一段内存当作代码段,仅仅是我们在编程时的一种安排,CPU并不会由于这种安排,就自动地将我们定义的代码段中的指令当作指令来执行。CPU只认被CS:IP指向的内存单元中的内容为指令。所以,要让CPU执行我们放在代码段中的指令,必须要将CS:IP指向所定义的代码段中的第一条指令的首地址。对于上面的例子,我们将一段代码存放在123B0H~123B9H内存单元中,将其定义为代码段,如果要让这段代码得到执行,可设CS=123BH、IP=0000H。
2.9~2.12 小结
(1) 段地址在8086CPU的段寄存器中存放。当8086CPU要访问内存时,由段寄存器提供内存单元的段地址。8086CPU有4个段寄存器,其中CS用来存放指令的段地址。
(2) CS存放指令的段地址,IP存放指令的偏移地址。 8086机中,任意时刻,CPU将CS:IP指向的内容当作指令执行。
(3) 8086CPU的工作过程:
① 从CS:IP指向的内存单元读取指令,读取的指令进入指令缓冲器;
② IP指向下一条指令;
③ 执行指令。(转到步骤①,重复这个过程。)
(4) 8086CPU提供转移指令修改CS、IP的内容。
检测点2.3
下面的3条指令执行后,CPU几次修改IP?都是在什么时候?最后IP中的值是多少?
mov ax,bx sub ax,ax jmp ax |
实验1 查看CPU和内存,用机器指令和汇编指令编程
1. 预备知识:Debug的使用
我们以后所有的实验中,都将用到Debug程序,首先学习一下它的主要用法。
(1) 什么是Debug?
Debug是DOS、Windows都提供的实模式(8086方式)程序的调试工具。使用它,可以查看CPU各种寄存器中的内容、内存的情况和在机器码级跟踪程序的运行。
(2) 我们用到的Debug功能。
用Debug的R命令查看、改变CPU寄存器的内容;
用Debug的D命令查看内存中的内容;
用Debug的E命令改写内存中的内容;
用Debug的U命令将内存中的机器指令翻译成汇编指令;
用Debug的T命令执行一条机器指令;
用Debug的A命令以汇编指令的格式在内存中写入一条机器指令。
Debug的命令比较多,共有20多个,但这6个命令是和汇编学习密切相关的。在以后的实验中,我们还会用到一个P命令。
(3) 进入Debug。
Debug是在DOS方式下使用的程序。我们在进入Debug前,应先进入到DOS方式。用以下方式可以进入DOS。
① 重新启动计算机,进入DOS方式,此时进入的是实模式的DOS。
② 在Windows中进入DOS方式,此时进入的是虚拟8086模式的DOS。
下面说明在Windows 2000中进入Debug的一种方法,在Windows 98中进入的方法与此类似。
选择【开始】菜单中的【运行】命令,如图2.28所示,打开【运行】对话框,如图2.29所示,在文本框中输入"command"后,单击【确定】按钮。
图2.28 选择【运行】命令
图2.29 在文本框中输入"command"
进入DOS方式后,如果显示为窗口方式,可以按下Alt+Enter键将窗口变为全屏方式。然后运行Debug程序,如图2.30所示,这个程序在Windows 98中通常在c:/windows98/command下,在Windows 2000中通常在c:/winnt/system下。由于系统指定了搜索路径,所以在任何一个路径中都可以运行。
图2.30 运行Debug程序
(4) 用R命令查看、改变CPU寄存器的内容。
我们已经知道了AX、BX、CX、DX、CS、IP这6个寄存器,现在看一下它们之中的内容,如图2.31所示。其他寄存器如SP、BP、SI、DI、DS、ES、SS、标志寄存器等我们先不予理会。
图2.31 使用R命令查看CPU中各个寄存器中的内容
注意CS和IP的值,CS=0CA2,IP=0100,也就是说,内存0CA2:0100处的指令为CPU当前要读取、执行的指令。在所有寄存器的下方,Debug还列出了CS:IP所指向的内存单元处所存放的机器码,并将它翻译为汇编指令。可以看到,CS:IP所指向的内存单元为0CA2:0100,此处存放的机器码为02 75 48,对应的汇编指令为ADD DH,[DI+48](这条指令的含义我们还不知道,先不必深究)。
Debug输出的右下角还有一个信息:"DS:0048=0",我们以后会进行说明,这里同样不必深究。
还可以用R命令来改变寄存器中的内容,如图2.32所示。
图2.32 用R命令修改寄存器AX中的内容
若要修改一个寄存器中的值,比如AX中的值,可用R 命令后加寄存器名来进行,输入"r ax"后按Enter键,将出现":"作为输入提示,在后面输入要写入的数据后按Enter键,即完成了对AX中内容的修改。若想看一下修改的结果,可再用R命令查看,如图2.33所示。
图2.33 用R命令修改CS和IP中的内容
在图2.33中,一进入Debug,用R命令查看,CS:IP指向0B39:0100,此处存放的机器码为40,对应的汇编指令是INC AX;
接着,用R命令将IP修改为200,则CS:IP指向0B39:0200,此处存放的机器码为5B,对应的汇编指令是POP BX;
接着,用R命令将CS修改为ff00,则CS:IP指向ff00:0200,此处存放的机器码为51,对应的汇编指令是PUSH CX。
(5) 用Debug的D命令查看内存中的内容。
用Debug的D命令,可以查看内存中的内容,D命令的格式较多,这里只介绍在本次实验中用到的格式。
如果我们想知道内存10000H处的内容,可以用"d 段地址:偏移地址"的格式来查看,如图2.34所示。
图2.34 用D命令查看内存1000:0处的内容
要查看内存10000H处的内容,首先将这个地址表示为段地址:偏移地址的格式,可以是1000:0,然后用"d 1000:0"列出1000:0处的内容。
使用"d 段地址:偏移地址"的格式,Debug将列出从指定内存单元开始的128个内存单元的内容。图2.34中,在使用d 1000:0后,Debug列出了1000:0~1000:7F中的内容。
使用D命令,Debug将输出3部分内容(如图2.34所示)。
① 中间是从指定地址开始的128个内存单元的内容,用十六进制的格式输出,每行的输出从16的整数倍的地址开始,最多输出16个单元的内容。从图中,我们可以知道,内存1000:0单元中的内容是72H,内存1000:1单元中的内容是64H,内存1000:0~1000:F中的内容都在第一行;内存1000:10中的内容是6DH,内存1000:11处的内容是61H,内存1000:10~1000:1F中的内容都在第二行。注意在每行的中间有一个"-",它将每行的输出分为两部分,这样便于查看。比如,要想从图中找出1000:6B单元中内容,可以从1000:60找到行,"-"前面是1000:60~1000:67的8个单元,后面是1000:68~1000:6F的8个单元,这样我们就可以从1000:68单元向后数3个单元,找到1000:6B单元,可以看到,1000:6B中的内容为67H。
② 左边是每行的起始地址。
③ 右边是每个内存单元中的数据对应的可显示的ASCII码字符。比如,内存单元1000:0、1000:1、1000:2中存放的数据是72H、64H、73H,它对应的ASCII字符分别是"r"、"d"、"s";内存单元1000:36中的数据是0AH,它没有对应可显示的ASCII字符,Debug就用"."来代替。
注意,我们看到的内存中的内容,在不同的计算机中是不一样的,也可能每次用Debug看到的内容都不相同,因为我们用Debug看到的都是原来就在内存中的内容,这些内容受随时都有可能变化的系统环境的影响。当然,我们也可以改变内存、寄存器中的内容。
我们使用d 1000:9查看1000:9处的内容,Debug将怎样输出呢?如图2.35所示。
图2.35 查看1000:9处的内容
Debug从1000:9开始显示,一直到1000:88,一共是128个字节。第一行中的1000:0~1000:8单元中的内容不显示。
在一进入Debug后,用D命令直接查看,将列出Debug预设的地址处的内容,如图2.36所示。
图2.36 列出Debug预设的地址处的内容
在使用"d 段地址:偏移地址"之后,接着使用D命令,可列出后续的内容,如图2.37所示。
也可以指定D命令的查看范围,此时采用"d 段地址:起始偏移地址 结尾偏移地址"的格式。比如要看1000:0~1000:9中的内容,可以用"d 1000:0 9"实现,如图2.38所示。
图2.37 列出后续的内容
图2.38 查看1000:0~1000:9单元中的内容
如果我们就想查看内存单元10000H中的内容,可以用图2.39中的任何一种方法看到,因为图中的所有"段地址:偏移地址"都表示了10000H 这一物理地址。
图2.39 用3种不同的段地址和偏移地址查看同一个物理地址中的内容
6) 用Debug的E命令改写内存中的内容。
可以使用E命令来改写内存中的内容,比如,要将内存1000:0~1000:9单元中的内容分别写为0、1、2、3、4、5、6、7、8、9,可以用"e 起始地址 数据 数据 数据 ……"的格式来进行,如图2.40所示。
图2.40 用E命令修改从1000:0开始的10个单元的内容
图2.41 用E命令修改从1000:10开始的4个单元的内容
如图2.41中,可以用E命令以提问的方式来逐个地修改从某一地址开始的内存单元中的内容,以从1000:10单元开始为例,步骤如下。
① 输入e 1000:10,按Enter键。
② Debug 显示起始地址1000:0010,和第一单元(即1000:0010单元)的原始内容:6D,然后光标停在"."的后面提示输入想要写入的数据,此时可以有两个选择:其一为输入数据(我们输入的是0),然后按空格键,即用输入的数据改写当前的内存单元;其二为不输入数据,直接按空格键,则不对当前内存单元进行改写。
③ 当前单元处理完成后(不论是改写或没有改写,只要按了空格键,就表示处理完成),Debug将接着显示下一个内存单元的原始内容,并提示进行修改,读者可以用同样的方法处理。
④ 所有希望改写的内存单元改写完毕后,按Enter键,E命令操作结束。
可以用E命令向内存中写入字符,比如,用E命令从内存1000:0开始写入数值1、字符"a"、数值2、字符"b"、数值3、字符"c",可采用图2.42中所示的方法进行。
图2.42 用E命令向内存中写入字符
从图2.42中可以看出,Debug对E命令的执行结果是,向1000:0、1000:2、1000:4单元中写入数值1、2、3,向1000:1、1000:3、1000: 5单元中写入字符"a"、"b"、"c"的ASCII码值:61H、62H、63H。
也可以用E命令向内存中写入字符串,比如,用E命令从内存1000:0开始写入:数值1、字符串"a+b"、数值2、字符串"c++"、字符3、字符串"IBM",如图2.43所示。
(7) 用E命令向内存中写入机器码,用U命令查看内存中机器码的含义,用T命令执行内存中的机器码。
图2.43 用E命令向内存中写入字符串
如何向内存中写入机器码呢?我们知道,机器码也是数据,当然可以用E命令将机器码写入内存。比如我们要从内存1000:0单元开始写入这样一段机器码:
机器码 对应的汇编指令 b80100 mov ax,0001 b90200 mov cx,0002 01c8 add ax,cx |
可用如图2.44中所示的方法进行。
图2.44 用E命令将机器码写入内存
如何查看写入的或内存中原有的机器码所对应的汇编指令呢?可以使用U命令。比如可以用U命令将从1000:0开始的内存单元中的内容翻译为汇编指令,并显示出来,如图2.45所示。
图2.45 用U命令将内存单元中的内容翻译为汇编指令显示
图2.45中,首先用E命令向从1000:0开始的内存单元中写入了8个字节的机器码;然后用D命令查看内存1000:0~1000:1f中的数据(从数据的角度看一下写入的内容);最后用U命令查看从1000:0开始的内存单元中的机器指令和它们所对应的汇编指令。
U命令的显示输出分为3部分,每一条机器指令的地址、机器指令、机器指令所对应的汇编指令。我们可以看到:
1000:0 处存放的是写入的机器码b8 01 00所组成的机器指令,对应的汇编指令是mov ax,1;
1000:3 处存放的是写入的机器码b9 02 00所组成的机器指令;对应的汇编指令是mov cx,2;
1000:6 处存放的是写入的机器码01 c8所组成的机器指令;对应的汇编指令是add ax,cx;
1000:8 处存放的是内存中的机器码03 49 42所组成的机器指令;对应的汇编指令是add cx,[bx+di+42]。
由此,我们可以再一次看到内存中的数据和代码没有任何区别,关键在于如何解释。
如何执行我们写入的机器指令呢?使用Debug的T命令可以执行一条或多条指令,简单地使用T命令,可以执行CS:IP指向的指令,如图2.46所示。
图2.46 使用T命令执行CS:IP指向的指令
图2.46中,首先用E命令向从1000:0开始的内存单元中写入了8个字节的机器码;然后用R命令查看CPU中寄存器的状态,可以看到,CS=0b39H、IP=0100H,指向内存0b39:0100;若要用T命令控制CPU执行我们写到1000:0的指令,必须先让CS:IP指向1000:0;接着用R命令修改CS、IP中的内容,使CS:IP指向1000:0。
完成上面的步骤后,就可以使用T命令来执行我们写入的指令了(此时,CS:IP指向我们的指令所在的内存单元)。执行T命令后,CPU执行CS:IP指向的指令,则1000:0处的指令b8 01 00(mov ax,0001)得到执行,指令执行后,Debug显示输出CPU中寄存器的状态。
注意,指令执行后,AX中的内容被改写为1,IP改变为IP+3(因为mov ax,0001的指令长度为3个字节),CS:IP指向下一条指令。
接着图2.46,我们可以继续使用T命令执行下面的指令,如图2.47所示。
图2.47 用T命令继续执行
在图2.47中,用T命令继续执行后面的指令,注意每条指令执行后,CPU相关寄存器内容的变化。
(8) 用Debug的A命令以汇编指令的形式在内存中写入机器指令。
前面我们使用E命令写入机器指令,这样做很不方便,最好能直接以汇编指令的形式写入指令。为此,Debug提供了A命令。 A命令的使用方法如图2.48所示。
图2.48 用A命令向从1000:0开始的内存单元中写入指令
图2.48中,首先用A命令,以汇编语言向从1000:0开始的内存单元中写入了几条指令,然后用D命令查看A命令的执行结果。可以看到,在使用A命令写入指令时,我们输入的是汇编指令,Debug将这些汇编指令翻译为对应的机器指令,将它们的机器码写入内存。
使用A命令写入汇编指令时,在给出的起始地址后直接按Enter键表示操作结束。
如图2.49中,简单地用A命令,从一个预设的地址开始输入指令。
图2.49 从一个预设的地址开始输入指令
本次实验中需要用到的命令
查看、修改CPU中寄存器的内容:R命令
查看内存中的内容:D命令
修改内存中的内容:E命令(可以写入数据、指令,在内存中,它们实际上没有区别)
将内存中的内容解释为机器指令和对应的汇编指令:U命令
执行CS:IP指向的内存单元处的指令:T命令
以汇编指令的形式向内存中写入指令:A命令
在预备知识中,详细讲解了Debug的基本功能和用法。在汇编语言的学习中,Debug是一个经常用到的工具,在学习预备知识中,应该一边看书一边在机器上操作。
前面提到,我们的原则是:以后用到的,以后再说。所以在这里只讲了一些在本次实验中需要用到的命令的相关的使用方法。以后根据需要,我们会讲解其他的用法。
2. 实验任务
(1) 使用Debug,将上面的程序段写入内存,逐条执行,观察每条指令执行后,CPU中相关寄存器中内容的变化。
机器码 汇编指令 b8 20 4e mov ax,4E20H 05 16 14 add ax,1416H bb 00 20 mov bx,2000H 01 d8 add ax,bx 89 c3 mov bx,ax 01 d8 add ax,bx b8 1a 00 mov ax,001AH bb 26 00 mov bx,0026H 00 d8 add al,bl 00 dc add ah,bl 00 c7 add bh,al b4 00 mov ah,0 00 d8 add al,bl 04 9c add al,9CH |
提示,可用E命令和A命令以两种方式将指令写入内存。注意用T命令执行时,CS:IP的指向。
(2) 将下面3条指令写入从2000:0开始的内存单元中,利用这3条指令计算2的8次方。
mov ax,1 add ax,ax jmp 2000:0003 |
(3) 查看内存中的内容。
PC机主板上的ROM中写有一个生产日期,在内存FFF00H~FFFFFH的某几个单元中,请找到这个生产日期并试图改变它。
提示,如果读者对实验的结果感到疑惑,请仔细阅读第1章中的1.15节。
(4) 向内存从B8100H开始的单元中填写数据,如:
-e B810:0000 01 01 02 02 03 03 04 04 |
请读者先填写不同的数据,观察产生的现象;再改变填写的地址,观察产生的现象。
提示,如果读者对实验的结果感到疑惑,请仔细阅读第1章中的1.15节。