PowerPC汇编指令集简析-(1)

时间:2022-08-09 01:28:02

    在了解PowerPC汇编指令前,需要先看下编程所用的寄存器模型,PowerPC系统结构为大多数运算指令都定义了Register-Register的操作,这些操作的源操作数从寄存器取得,或作为嵌入指令操作码中的立即数提供。这里的e300核可分为用户编程模型和管理员编程模型,该模型有32个GPR、32个FPR、特殊目的寄存器SPR和一些功能寄存器,下图为二者的示意图:

PowerPC汇编指令集简析-(1)

PowerPC汇编指令集简析-(1)

    上面这些寄存器可能不太好理解,因为名字和Intel汇编不一样,其实,可以这样理解,GPR就相当于EAX/EBX/ECX,而CTR则完全就是ECX的功能,是吧?区别就是没有堆栈而已咯。CR被分为8段,每段4位,分别代表LT、GT、EQ和SO(小于、大于、等于和溢出);LR用于记录跳转地址;特殊寄存器XER用于记录溢出和进位标志;FPSCR用于记录浮点运算类型和异常等。

    再看下指令集,大部分的CPU指令集可分为:数据读写、数值计算、流程控制和设备管理四个部分,由于PowerPC使用RISC,指令字长为32bit,Endian一般是可调的,默认为大端,另外,PowerPC没有栈,所以程序需要自己实现相关操作。首先为运算和逻辑指令,列举如下:

 

PowerPC汇编指令集简析-(1)

 

    它们与通用寄存器有关,源数据来自GPR 或16 位立即数,目的是GPR 寄存器,操作为32 位,GPR 中存放32 位更新数据。大多数指令都可以根据字面意思理解其作用,注意还有一个“cntlzw”指令,意为计算字中的第一个0,用于在一个字中找到1时将一个指令中的0的数量找出,它在决定例外寄存器中最高优先服务时有用。

    下面是数据读写指令,它们对数据在存储器中核通用寄存器中的传送很有用,若数据小于传送长度(单字,半字或字节),指令会使数据变位为32位,将不同位填0或符号扩展。指令列举如下:

 

PowerPC汇编指令集简析-(1)

 

    这里需要注意的是上面列举的lbz和lhz两个指令并不完全等同于mov al,[ebx]和mov ax,[ebx+10]这两个,因为前面两个是将字节和半字加载到r3时还清空了高位,而后两条指令只是加载数据到eax,并不会清空高位

    另外,还有两个指令sthbrw和stwbrx,对PowerPC存取小端格式数据很有用,它们允许存取这样的数据,若数据以小端顺序进入总线,就把它存为大端顺序。

    好了,现在来详细看下赋值指令,下面是最常见的赋值代码:

lis    r3,0x1234

addi r3,r3,0x5678

这段代码的含义是将0x12345678加载到寄存器r3中。因为在RISC下,PowerPC的每条指令都是32bit,除去指令和寄存器参数编码,只剩下16bit的长度描述立即数,如立即数加载指令li:

PowerPC汇编指令集简析-(1)

这样立即数SIMM只有16位,所以需要两次加载,使用lis(立即数载入并左移)和addi(立即数加法)两条指令完成。

再看下PowerPC不同的子程序调用:

func:       /* 子程序入口 */
blr /* 返回(跳转到lr地址) */
start:
bl func /* 调用func(跳转并保存地址到lr) */
li r1,1 /* 设置r1、r3 */
li r3,1
sc /* 系统调用,结束程序 */

    这里的调用由PowerPC使用lr寄存器完成,在bl指令跳转前,下一条指令li r1,1的地址会被保存在lr,而执行的func中的blr时,系统会跳到lr表示的地址,完成返回。

    再来介绍下特殊寄存器的操作指令,它们可以完成特殊用途寄存器之间和通用寄存器之间的数据交换,不可以直接对特殊用途寄存器中的值进行处理,但是,可以将一个值先拷贝到一个通用寄存器上处理,再将信息存到特殊用途寄存器上。下面是指令集合:

PowerPC汇编指令集简析-(1)

这里回顾下,PowerPC里没有堆栈,那用什么实现模拟呢?看下面的例子:

f1:
mflr r2 /*保存lr中记录的地址到r2*/
stw r2,-8(r1) /*记录r2的值到mem[r1-8]*/
addi r1,r1,-60 /*r1后移60个字节,完成进栈操作*/
...
addi r1,r1,60 /*r1前移60个字节,准备出栈*/
lwz r2,-8(r1) /*读出老的lr值到r2*/
mtfr r2 /*将r2的内容复制到lr*/
blr /*返回(跳转到lr地址)*/
start:
...
bl f1 /*调用f1(跳转并保持地址到lr)*/

    看到了吧,虽然没有提供栈的相关指令(PUSH/POP/CALL/RET),但应用程序可以用r1模拟栈指针,实现多层调用对LR的记录和恢复。

    前面说了,PowerPC指令为32位长,指令内仅有16位用于加载常量值,由于地址最多可达到64位,所以我们可以采用每次一段的方式载入地址,汇编程序中的@符号指示汇编程序给出一个符号值的特殊处理形式:@highest:表示一个常量的第48-63位;@higher:表示一个常量的第32-48位;@h:16-31位;@l:0-15位。

    下面是我们的一个稍大点的PowerPC汇编程序总结下上面的指令集,实现的功能就是载入两个值并相加,最后退出,以结果为状态代码输出。代码如下:

#sum.s,第一个PowerPC汇编程序
.data
.align 3
#此处装载两个值
first_value:
.quad 1
second_value:
.quad 2
#写”.opd”(official procedure descriptor)
.section “.opd”,”aw”
.align 3
#._start的程序描述符,即为程序名
.global _start
_start:
.quad .start, .TOC.@tocbase,0
#._text为程序代码段
.text
._start:
#装载地址高位
lis r7,first_value@highest
ori r7,r7,first_value@higher
#shift these up to the high-order bits
rldier r7,r7,32,31
#装载地址低位
oris r7,r7,first_value@h
ori r7,r7,first_value@l
#将第一个值载入寄存器4
ld r4,0(r7)
lis r7,second_value@highest
ori r7,r7,second_value@higher
rldicr r7,r7,32,31
oris r7,r7,second_value@h
ori r7,r7,second_value@l
ld r5,0(r7)
#二者相加并存到寄存器6
add r6,r4,r5
#程序退出
li 0,1 #寄存器0为系统调用
mr r3,r6 #将结果移到寄存器3中
sc #对内核进行系统调用