C语言代码如下:
void swap(int *a, int *b)
{
int c;
c = *a;
*a = *b;
*b = c;
}
对应的汇编代码:
Dump of assembler code for function swap:
0x00000000004004ed <+0>: push %rbp
0x00000000004004ee <+1>: mov %rsp,%rbp
0x00000000004004f1 <+4>: mov %rdi,-0x18(%rbp) ; 参数由rdi和rsi寄存器传入,是两个地址
0x00000000004004f5 <+8>: mov %rsi,-0x20(%rbp) ; 不明白它为什么要先保存,而不直接使用寄存器
=> 0x00000000004004f9 <+12>: mov -0x18(%rbp),%rax
0x00000000004004fd <+16>: mov (%rax),%eax
0x00000000004004ff <+18>: mov %eax,-0x4(%rbp)
0x0000000000400502 <+21>: mov -0x20(%rbp),%rax
0x0000000000400506 <+25>: mov (%rax),%edx
0x0000000000400508 <+27>: mov -0x18(%rbp),%rax
0x000000000040050c <+31>: mov %edx,(%rax)
0x000000000040050e <+33>: mov -0x20(%rbp),%rax
0x0000000000400512 <+37>: mov -0x4(%rbp),%edx
0x0000000000400515 <+40>: mov %edx,(%rax)
0x0000000000400517 <+42>: pop %rbp
0x0000000000400518 <+43>: retq
End of assembler dump.
参数既然都是通过寄存器传入了,而且在后面的汇编代码中也可以看到,rsi和rdi的值并没有改变,那为什么还要对传入的参数做保存呢?这有什么特殊的含义么?
5 个解决方案
#1
你这个是debug版本的编译结果,不会进行优化。是一行行直译的结果,所以显得比较傻。
换成release编译,没用的操作就会被优化掉了。
换成release编译,没用的操作就会被优化掉了。
#2
我采用gcc src.c 编译生成a.out,也是一样。
Dump of assembler code for function swap:
0x00000000004004ed <+0>: push %rbp
0x00000000004004ee <+1>: mov %rsp,%rbp
0x00000000004004f1 <+4>: mov %rdi,-0x18(%rbp)
0x00000000004004f5 <+8>: mov %rsi,-0x20(%rbp)
=> 0x00000000004004f9 <+12>: int3
0x00000000004004fa <+13>: mov -0x18(%rbp),%eax
0x00000000004004fd <+16>: mov (%rax),%eax
0x00000000004004ff <+18>: mov %eax,-0x4(%rbp)
0x0000000000400502 <+21>: mov -0x20(%rbp),%rax
0x0000000000400506 <+25>: mov (%rax),%edx
0x0000000000400508 <+27>: mov -0x18(%rbp),%rax
0x000000000040050c <+31>: mov %edx,(%rax)
0x000000000040050e <+33>: mov -0x20(%rbp),%rax
0x0000000000400512 <+37>: mov -0x4(%rbp),%edx
0x0000000000400515 <+40>: mov %edx,(%rax)
0x0000000000400517 <+42>: pop %rbp
0x0000000000400518 <+43>: retq
End of assembler dump.
#3
你这个没有优化,试试
gcc -O2 src.c
注意O是大写的
gcc -O2 src.c
注意O是大写的
#4
这确实是优化了。有点看不懂。
#5
gcc -O2 -S -o o2.s src.c
这样感觉好多了, 谢谢您的指点!!!
.file "exch.c"
.text
.p2align 4,,15
.globl swap
.type swap, @function
swap:
.LFB24:
.cfi_startproc
movl (%rdi), %eax
movl (%rsi), %edx
movl %edx, (%rdi)
movl %eax, (%rsi)
ret
.cfi_endproc
.LFE24:
.size swap, .-swap
.section .text.startup,"ax",@progbits
.p2align 4,,15
.globl main
.type main, @function
main:
.LFB25:
.cfi_startproc
movl $16, %eax
ret
.cfi_endproc
.LFE25:
.size main, .-main
.ident "GCC: (Ubuntu 4.8.2-19ubuntu1) 4.8.2"
.section .note.GNU-stack,"",@progbits
#1
你这个是debug版本的编译结果,不会进行优化。是一行行直译的结果,所以显得比较傻。
换成release编译,没用的操作就会被优化掉了。
换成release编译,没用的操作就会被优化掉了。
#2
我采用gcc src.c 编译生成a.out,也是一样。
Dump of assembler code for function swap:
0x00000000004004ed <+0>: push %rbp
0x00000000004004ee <+1>: mov %rsp,%rbp
0x00000000004004f1 <+4>: mov %rdi,-0x18(%rbp)
0x00000000004004f5 <+8>: mov %rsi,-0x20(%rbp)
=> 0x00000000004004f9 <+12>: int3
0x00000000004004fa <+13>: mov -0x18(%rbp),%eax
0x00000000004004fd <+16>: mov (%rax),%eax
0x00000000004004ff <+18>: mov %eax,-0x4(%rbp)
0x0000000000400502 <+21>: mov -0x20(%rbp),%rax
0x0000000000400506 <+25>: mov (%rax),%edx
0x0000000000400508 <+27>: mov -0x18(%rbp),%rax
0x000000000040050c <+31>: mov %edx,(%rax)
0x000000000040050e <+33>: mov -0x20(%rbp),%rax
0x0000000000400512 <+37>: mov -0x4(%rbp),%edx
0x0000000000400515 <+40>: mov %edx,(%rax)
0x0000000000400517 <+42>: pop %rbp
0x0000000000400518 <+43>: retq
End of assembler dump.
#3
你这个没有优化,试试
gcc -O2 src.c
注意O是大写的
gcc -O2 src.c
注意O是大写的
#4
这确实是优化了。有点看不懂。
#5
gcc -O2 -S -o o2.s src.c
这样感觉好多了, 谢谢您的指点!!!
.file "exch.c"
.text
.p2align 4,,15
.globl swap
.type swap, @function
swap:
.LFB24:
.cfi_startproc
movl (%rdi), %eax
movl (%rsi), %edx
movl %edx, (%rdi)
movl %eax, (%rsi)
ret
.cfi_endproc
.LFE24:
.size swap, .-swap
.section .text.startup,"ax",@progbits
.p2align 4,,15
.globl main
.type main, @function
main:
.LFB25:
.cfi_startproc
movl $16, %eax
ret
.cfi_endproc
.LFE25:
.size main, .-main
.ident "GCC: (Ubuntu 4.8.2-19ubuntu1) 4.8.2"
.section .note.GNU-stack,"",@progbits