AT&T汇编格式与Intel汇编格式的比较

时间:2021-11-16 13:36:36

GCC采用的是AT&T的汇编格式, 也叫GAS格式(Gnu ASembler GNU汇编器), 而微软采用Intel的汇编格式.
一 基本语法
语法上主要有以下几个不同.
1、寄存器命名原则

AT&T Intel 说明
%eax eax Intel的不带百分号


2、源/目的操作数顺序

AT&T Intel 说明
movl %eax, %ebx mov ebx, eax Intel的目的操作数在前,源操作数在后


3、常数/立即数的格式

AT&T Intel 说明
movl $_value,%ebx mov eax,_value Intel的立即数前面不带$符号
movl $0xd00d,%ebx mov ebx,0xd00d 规则同样适用于16进制的立即数


4、操作数长度标识

AT&T Intel 说明
movw %ax,%bx mov bx,ax Intel的汇编中, 操作数的长度并不通过指令符号来标识

在AT&T的格式中, 每个操作都有一个字符后缀, 表明操作数的大小. 例如:mov指令有三种形式:

movb  传送字节

movw  传送字

movl   传送双字

因为在许多机器上, 32位数都称为长字(long word), 这是沿用以16位字为标准的时代的历史习惯造成的.
果没有指定操作数长度的话,编译器将按照目标操作数的长度来设置。比如指令“mov %ax, %bx”,由于目标操作数bx的长度为word,那么编译器将把此指令等同于“movw %ax, %bx”。同样道理,指令“mov $4, %ebx”等同于指令“movl $4, %ebx”,“push %al”等同于“pushb %al”。对于没有指定操作数长度,但编译器又无法猜测的指令,编译器将会报错,比如指令“push $4”。


5、寻址方式

AT&T Intel
imm32(basepointer,indexpointer,indexscale) [basepointer + indexpointer*indexscale + imm32)

两种寻址的实际结果都应该是

imm32 + basepointer + indexpointer*indexscale
例如: 下面是一些寻址的例子:

AT&T: `-4(%ebp)'         相当于 Intel: `[ebp - 4]'

AT&T: `foo(,%eax,4)'    相当于 Intel: `[foo + eax*4]'
AT&T: `foo(,1)'             相当于 Intel `[foo]'
AT&T: `%gs:foo'           相当于 Intel`gs:foo'
AT&T: movl -4(%ebp), %eax                  相当于 Intel: mov eax, [ebp - 4]
AT&T:movl array(, %eax, 4), %eax          相当于 Intel: mov eax, [eax*4 + array]
AT&T:movw array(%ebx, %eax, 4), %cx  相当于 Intel: mov cx, [ebx + 4*eax + array]
AT&T:movb $4, %fs:(%eax)                   相当于 Intel: mov fs:eax, 4

6.跳转方式
6.1在 AT&T 汇编格式中,绝对转移和调用指令(jump/call)的操作数前要加上'*'作为前缀,而在 Intel 格式中则不需要。
AT&T:
jmp *%eax 用寄存器%eax中的值作为跳转目标
jmp *(%eax) 以%eax中的值作为读入的地址, 从存储器中读出跳转目标

Intel:不需要*作为前缀
jmp %eax
jmp (%eax)
6.2远程转移指令和远程子调用指令的操作码,在 AT&T 汇编格式中为 "ljump" 和 "lcall",而在 Intel 汇编格式中则为 "jmp far" 和 "call far",即:
AT&T:
ljump $section, $offset
lcall $section, $offset

Intel:
jmp far section:offset
call far section:offset