经常会在linux内核中看到汇编,而这个汇编又和正常的汇编不太一样,这个就是GCC中的内嵌汇编了。前先天,在移植dvb的frontend的时候看到了mb();这个函数,发现最终其执行的就是
- #define barrier __asm__ __volatile__(“”: : : “memory”)
就是不解其中的意思,网上查查资料才发现是嵌入了汇编。看到asm,相信谁都知道是汇编了,但是,这个有什么作用呢?ldd3中也有解释,那就是内存屏蔽,是为了屏蔽编译器的优化的。但是,什么内存屏蔽,什么编译器优化,都不懂咋办呢?还有这个汇编什么意思都不懂,咋办呢?
还是从头开始吧,万事开头难,从那个汇编代码的意思一步一步下去,总会明白的。个人习惯,要知道代码的意思,跑个程序,边调试边理解,那时最好不过的了。不多说,直接上代码:
- #include <stdio.h>
- #include <string.h>
- #include <stdlib.h>
- #define LOCK_PREFIX ""
- #define ADDR (*(volatile struct __dummy *) addr)
- /*__asm__(汇编语句模板: 输出部分: 输入部分: 破坏描述部分)*/
- /*汇编语句模板*/
- //语句之间使用“;”、“\n”或“\n\t”分开
- //指令中的操作数可以使用占位符引用C语言变量,
- //操作数占位符最多10个,名称如下:%0,%1,...,%9
- /*输出部分*/
- //输出部分描述输出操作数,不同的操作数描述符之间用逗号格开,
- //每个操作数描述符由限定字符串和C语言变量组成。
- //每个输出操作数的限定字符串必须包含“=”表示他是一个输出操作数
- /*输入部分*/
- //每个操作数描述符由限定字符串和C语言表达式或者C语言变量组成
- /*破坏描述部分*/
- //由逗号格开的字符串组成,每个字符串描述
- //一种情况,一般是寄存器名;除寄存器外还有“memory”。
- //例如:“%eax”,“%ebx”,“memory”等
- static __inline__ void set_bit(int nr, volatile void *addr)
- {
- __asm__ __volatile__(LOCK_PREFIX
- "btsl %1, %0" //嵌入的汇编语言指令,btcl为指令操作码,%1,%0是这条指令两个操作数的占位符
- :"=m" (ADDR) //"输出"操作数
- :"ir" (nr)); //"输入"操作数
- }
- static __inline__ void add(int bb, volatile int *aa)
- {
- __asm__ __volatile__(
- "addl %2, %0"
- :"=r" (*aa)
- :"0" (*aa), "g"(bb)
- );
- }
- int main()
- {
- int addr = 0xfff0;
- int aa = 1, bb = 2;
- int output, temp;
- int input = 6;
- #if 0
- asm volatile(
- "addl %2, %0"
- :"=r" (aa)
- :"0" (aa), "g"(bb)
- );
- #endif
- #if 0
- add(bb, &aa);
- printf("%d\n\n", aa);
- printf("before: %x\n", addr);
- set_bit(2, &addr);
- printf("after: %x\n\n", addr);
- #endif
- #if 1
- __asm__ __volatile__("movl $0, %%eax;\n\t \
- movl %%eax, %1;\n\t \
- movl %2, %%eax;\n\t \
- movl %%eax, %0;\n\t"
- :"=m"(output),"=m"(temp) /* output */
- :"r"(input) /* input */
- //:"eax"
- );
- /*通过破坏描述部分,GCC得知%eax已被使用,因此给 input 分配了%edx。
- 在使用内嵌汇编时请记住一点:尽量告诉GCC尽可能多的信息,以防出错*/
- printf("output: %d\n",output);
- #endif
- return 0;
- }
代码中都有了详细的解释了,相信看了之后,加上跑一把,那么问题都可以迎刃而解了。
这里主要降下,那个
- __asm__ __volatile__("movl $0, %%eax;\n\t \
- movl %%eax, %1;\n\t \
- movl %2, %%eax;\n\t \
- movl %%eax, %0;\n\t"
- :"=m"(output),"=m"(temp) /* output */
- :"r"(input) /* input */
- //:"eax"
- );
不难看出,这个代码的意思就是 temp=0;output = input;但是如果就是上面的代码的话。那么output永远是0.。
如果把最后一行加上:"eax"的话,那么结果就是对的了。这个就是破坏描述部分的意义所在了。
那么什么是编译器优化呢?
内存访问速度远不及CPU处理速度,为提高机器整体性能,在硬件上引入硬件高速缓存Cache,加速对内存的访问。另外在现代 CPU中指令的执行并不一定严格按照顺序执行,没有相关性的指令可以乱序执行,以充分利用CPU的指令流水线,提高执行速度。
以上是硬件级别的优化。再看软件一级的优化:一种是在编写代码时由程序员优化,另
一种是由编译器进行优化。编译器优化常用的方法有:将内存变量缓存到寄存器;调整指令顺序充分利用CPU指令流水线,常见的是重新排序读写指令。对常规内存进行优化的时候,这些优化是透明的,而且效率很好。由编译器优化或者硬件重新排序引起的问题的解决办法是在从硬件(或者其他处理器)的角度看必须以特定顺序执行的操作之间设置内存屏障(memory barrier),linux提供了一个宏解决编译器的执行顺序问题。
void barrier(void)
这个函数通知编译器插入一个内存屏障,但对硬件无效,编译后的代码会把当前CPU寄存器中的所有修改过的数值存入内存,需要这些数据的时候再重新从内存中读出。
相信你看这篇文章的话,肯定知道volatile这个关键字,它的意思,就是这个变量随时会被改变,所以不能直接保存在寄存器中,不能被优化,而是要用到就存取。
经常,在一个线程当中,很多内存是共享的,而共享的内存中的数据,随时有被其他的线程所改变。所以有了volatile这个关键字可以帮上很多忙。
而#define barrier __asm__ __volatile__(“”: : : “memory”)也起到了这个作用。
使用“volatile”也可以达到这个目的,但是我们在每个变量前增加该关键字,不如使用
“memory”方便。
好了,相信现在,对于为什么用哪个barrier,有了更加详细的了解了吧。
下面贴个AT&T的汇编指令
GAS中每个操作都是有一个字符的后缀,表明操作数的大小。
C声明 |
GAS后缀 |
大小(字节) |
char |
b |
1 |
short |
w |
2 |
(unsigned) int / long / char* |
l |
4 |
float |
s |
4 |
double |
l |
8 |
long double |
t |
10/12 |
注意:GAL使用后缀“l”同时表示4字节整数和8字节双精度浮点数,这不会产生歧义因为浮点数使用的是完全不同的指令和寄存器。
操作数格式:
格式 |
操作数值 |
名称 |
样例(GAS = C语言) |
$Imm |
Imm |
立即数寻址 |
$1 = 1 |
Ea |
R[Ea] |
寄存器寻址 |
%eax = eax |
Imm |
M[Imm] |
绝对寻址 |
0x104 = *0x104 |
(Ea) |
M[R[Ea]] |
间接寻址 |
(%eax)= *eax |
Imm(Ea) |
M[Imm+R[Ea]] |
(基址+偏移量)寻址 |
4(%eax) = *(4+eax) |
(Ea,Eb) |
M[R[Ea]+R[Eb]] |
变址 |
(%eax,%ebx) = *(eax+ebx) |
Imm(Ea,Eb) |
M[Imm+R[Ea]+R[Eb]] |
寻址 |
9(%eax,%ebx)= *(9+eax+ebx) |
(,Ea,s) |
M[R[Ea]*s] |
伸缩化变址寻址 |
(,%eax,4)= *(eax*4) |
Imm(,Ea,s) |
M[Imm+R[Ea]*s] |
伸缩化变址寻址 |
0xfc(,%eax,4)= *(0xfc+eax*4) |
(Ea,Eb,s) |
M(R[Ea]+R[Eb]*s) |
伸缩化变址寻址 |
(%eax,%ebx,4) = *(eax+ebx*4) |
Imm(Ea,Eb,s) |
M(Imm+R[Ea]+R[Eb]*s) |
伸缩化变址寻址 |
8(%eax,%ebx,4) = *(8+eax+ebx*4) |
注:M[xx]表示在存储器中xx地址的值,R[xx]表示寄存器xx的值,这种表示方法将寄存器、内存都看出一个大数组的形式。
数据传送指令:
指令 |
效果 |
描述 |
movl S,D |
D <-- S |
传双字 |
movw S,D |
D <-- S |
传字 |
movb S,D |
D <-- S |
传字节 |
movsbl S,D |
D <-- 符号扩展S |
符号位填充(字节->双字) |
movzbl S,D |
D <-- 零扩展S |
零填充(字节->双字) |
pushl S |
R[%esp] <-- R[%esp] – 4; M[R[%esp]] <-- S |
压栈 |
popl D |
D <-- M[R[%esp]]; R[%esp] <-- R[%esp] + 4; |
出栈 |
注:均假设栈往低地址扩展。
算数和逻辑操作地址:
指令 |
效果 |
描述 |
leal S,D |
D = &S |
movl地版,S地址入D,D仅能是寄存器 |
incl D |
D++ |
加1 |
decl D |
D-- |
减1 |
negl D |
D = -D |
取负 |
notl D |
D = ~D |
取反 |
addl S,D |
D = D + S |
加 |
subl S,D |
D = D – S |
减 |
imull S,D |
D = D*S |
乘 |
xorl S,D |
D = D ^ S |
异或 |
orl S,D |
D = D | S |
或 |
andl S,D |
D = D & S |
与 |
sall k,D |
D = D << k |
左移 |
shll k,D |
D = D << k |
左移(同sall) |
sarl k,D |
D = D >> k |
算数右移 |
shrl k,D |
D = D >> k |
逻辑右移 |
特殊算术操作:
指令 |
效果 |
imull S |
R[%edx]:R[%eax] = S * R[%eax] |
mull S |
R[%edx]:R[%eax] = S * R[%eax] |
cltd S |
R[%edx]:R[%eax] = 符号位扩展R[%eax] |
idivl S |
R[%edx] = R[%edx]:R[%eax] % S; R[%eax] = R[%edx]:R[%eax] / S; |
divl S |
R[%edx] = R[%edx]:R[%eax] % S; R[%eax] = R[%edx]:R[%eax] / S; |
注:64位数通常存储为,高32位放在edx,低32位放在eax。
条件码:
条件码寄存器描述了最近的算数或逻辑操作的属性。
CF:进位标志,最高位产生了进位,可用于检查无符号数溢出。
OF:溢出标志,二进制补码溢出——正溢出或负溢出。
ZF:零标志,结果为0。
SF:符号标志,操作结果为负。
比较指令:
指令 |
基于 |
描述 |
cmpb S2,S1 |
S1 – S2 |
比较字节,差关系 |
testb S2,S1 |
S1 & S2 |
测试字节,与关系 |
cmpw S2,S1 |
S1 – S2 |
比较字,差关系 |
testw S2,S1 |
S1 & S2 |
测试字,与关系 |
cmpl S2,S1 |
S1 – S2 |
比较双字,差关系 |
testl S2,S1 |
S1 & S2 |
测试双字,与关系 |
访问条件码指令:
指令 |
同义名 |
效果 |
设置条件 |
sete D |
setz |
D = ZF |
相等/零 |
setne D |
setnz |
D = ~ZF |
不等/非零 |
sets D |
|
D = SF |
负数 |
setns D |
|
D = ~SF |
非负数 |
setg D |
setnle |
D = ~(SF ^OF) & ZF |
大于(有符号>) |
setge D |
setnl |
D = ~(SF ^OF) |
小于等于(有符号>=) |
setl D |
setnge |
D = SF ^ OF |
小于(有符号<) |
setle D |
setng |
D = (SF ^ OF) | ZF |
小于等于(有符号<=) |
seta D |
setnbe |
D = ~CF & ~ZF |
超过(无符号>) |
setae D |
setnb |
D = ~CF |
超过或等于(无符号>=) |
setb D |
setnae |
D = CF |
低于(无符号<) |
setbe D |
setna |
D = CF | ZF |
低于或等于(无符号<=) |
跳转指令:
指令 |
同义名 |
跳转条件 |
描述 |
jmp Label |
|
1 |
直接跳转 |
jmp *Operand |
|
1 |
间接跳转 |
je Label |
jz |
ZF |
等于/零 |
jne Label |
jnz |
~ZF |
不等/非零 |
js Label |
|
SF |
负数 |
jnz Label |
|
~SF |
非负数 |
jg Label |
jnle |
~(SF^OF) & ~ZF |
大于(有符号>) |
jge Label |
jnl |
~(SF ^ OF) |
大于等于(有符号>=) |
jl Label |
jnge |
SF ^ OF |
小于(有符号<) |
jle Label |
jng |
(SF ^ OF) | ZF |
小于等于(有符号<=) |
ja Label |
jnbe |
~CF & ~ZF |
超过(无符号>) |
jae Label |
jnb |
~CF |
超过或等于(无符号>=) |
jb Label |
jnae |
CF |
低于(无符号<) |
jbe Label |
jna |
CF | ZF |
低于或等于(无符号<=) |
转移控制指令:(函数调用):
指令 |
描述 |
call Label |
过程调用,返回地址入栈,跳转到调用过程起始处,返回地址是call后面那条指令的地址 |
call *Operand |
|
leave |
为返回准备好栈,为ret准备好栈,主要是弹出函数内的栈使用及%ebp |
http://blog.csdn.net/eastmoon502136/article/details/8084754