AT&T格式汇编学习

时间:2023-02-06 03:15:34

Linux内核代码大量使用内嵌汇编,以进行某些特定功能的实现,或对某功能进行快速实现。使用的汇编格式为AT&T,本文就该种格式的汇编和Intel格式的汇编进行讲述。网络上也有众多文章涉及到这方面,所以本文更多是归纳总结。形成自己的学习笔记。

一、 大小写 

INTEL格式的指令使用大写字母,而AT&T格式的使用小写字母。 

二、 操作数赋值方向 

在INTEL语法中,第一个表示目的操作数,第二个表示源操作数,赋值方向从右向左。
AT&T语法第一个为源操作数,第二个为目的操作数,方向从左到右,合乎自然。 
示例:将ebx的值赋给eax:
INTEL:MOV EAX,EBX
AT&T:movl %ebx,%eax 

三、前缀 

在 INTEL 语法中寄存器和立即数不需要前缀;
AT&T 中寄存器需要加前缀“%” ,而立即数需要加前缀“$” 。 
示例:将1赋值给eax:
INTEL:MOV EAX,1
AT&T:movl $1,%eax 

符号常数直接引用,不需要加前缀,如:“movl value , %ebx”语句中value为一常数。在符号前加前缀$表示引用符号地址,如:“movl $value, %ebx”是将value的地址放到 ebx中。 
总线锁定前缀“lock” :总线锁定操作。 “lock”前缀在Linux 核心代码中使用很多,特别是SMP代码中。当总线锁定后其它CPU不能存取锁定地址处的内存单元。远程跳转指令和子过程调用指令的操作码使用前缀“l”,分别为 ljmp,lcall,与之相应的返回指令为lret。 
示例: 
INTEL                                                AT&T 
CALL FAR SECTION:OFFSET          lcall $secion:$offset 
JMP FAR SECTION:OFFSET            ljmp $secion:$offset 
RET FAR SATCK_ADJUST               lret $stack_adjust 

四、间接寻址语法 

INTEL中基地址使用“[” 、“]” ,而在 AT&T 中使用“(”、“)” ;另外处理复杂操作数的语法也不同,INTEL 为
“Segreg:[base+index*scale+disp] ”。而在 AT&T 中为“%segreg:disp(base,index,sale)”,其中segreg,index,scale,disp都是可选的,在指定index而没有显式指定Scale的情况下使用默认值 1。scale和 disp不需要加前缀“&” 。 
示例:
INTEL  INSTR  FOO,SEGREG:[BASE+INDEX*SCALE+DISP] 
AT&T  instr  %segreg:disp(base,index,scale),foo 

五、 后缀 

AT&T语法中大部分指令操作码的最后一个字母表示操作数大小, “b”表示 byte(一个字节),“w”表示 word(2 个字节),“l”表示 long(4 个字节)。INTEL 中处理内存操作数时也有类似的语法,如:BYTE PTR、WORD PTR、DWORD PTR。 
示例: 
INTEL                               AT&T 
MOV AL, BL                      movb %bl,%al 
MOV AX,BX                       movw %bx,%ax 
MOV EAX, DWORD PTR[EBX]         movl (%ebx), %eax 

在 AT&T 汇编指令中,操作数扩展指令有两个后缀,一个指定源操作数的字长,另一个指定目标操作数的字长。AT&T 的符号扩展指令的为“movs” ,零扩展指令为“movz” (相应的 Intel指令为“movsx”和“movzx”) 。因此, “movsbl %al,%edx”表示对寄存器 al 中的
字节数据进行字节到长字的符号扩展,计算结果存放在寄存器edx中。下面是一些允许的操作数扩展后缀:  
bl: 字节->长字  
bw: 字节->字  
wl: 字->长字  
 
跳转指令标号后的后缀表示跳转方向, “f” 表示向前 (forward) , “b” 表示向后 (back) 。  
例: jmp 1f 
xxx
jmp 1f 
1:
    mov $0x8000C580, %eax


李迟2016.2.16 晚