在C语言中,教科书告诉我们switch...case...语句比if...else if...else执行效率要高,但这到底是为什么呢?本文尝试从汇编的角度予以分析并揭晓其中的奥秘。
第一步,写一个demo程序:foo.c
#include <stdio.h> static int
foo_ifelse(char c)
{
if (c == '' || c == '') {
c += ;
} else if (c == 'a' || c == 'b') {
c += ;
} else if (c == 'A' || c == 'B') {
c += ;
} else {
c += ;
} return (c);
} static int
foo_switch(char c)
{
switch (c) {
case '':
case '': c += ; break;
case 'b':
case 'a': c += ; break;
case 'B':
case 'A': c += ; break;
default: c += ; break;
} return (c);
} int
main(int argc, char **argv)
{
int m1 = foo_ifelse('');
int m2 = foo_ifelse('');
int n1 = foo_switch('a');
int n2 = foo_switch('b');
(void) printf("%c %c %c %c\n", m1, m2, n1, n2);
return ();
}
第二步,在Ubuntu上使用gcc编译
$ gcc -g -o foo foo.c
第三步,使用gdb对二进制文件foo反汇编 (使用intel语法)
o 反汇编foo_ifelse()
(gdb) set disassembly-flavor intel
(gdb) disas /m foo_ifelse
Dump of assembler code for function foo_ifelse:
{
0x0804841d <+>: push ebp
0x0804841e <+>: mov ebp,esp
0x08048420 <+>: sub esp,0x4
0x08048423 <+>: mov eax,DWORD PTR [ebp+0x8]
0x08048426 <+>: mov BYTE PTR [ebp-0x4],al if (c == '' || c == '') {
0x08048429 <+>: cmp BYTE PTR [ebp-0x4],0x30
0x0804842d <+>: je 0x8048435 <foo_ifelse+>
0x0804842f <+>: cmp BYTE PTR [ebp-0x4],0x31
0x08048433 <+>: jne 0x8048441 <foo_ifelse+> c += ;
0x08048435 <+>: movzx eax,BYTE PTR [ebp-0x4]
0x08048439 <+>: add eax,0x1
0x0804843c <+>: mov BYTE PTR [ebp-0x4],al
0x0804843f <+>: jmp 0x804847b <foo_ifelse+> } else if (c == 'a' || c == 'b') {
0x08048441 <+>: cmp BYTE PTR [ebp-0x4],0x61
0x08048445 <+>: je 0x804844d <foo_ifelse+>
0x08048447 <+>: cmp BYTE PTR [ebp-0x4],0x62
0x0804844b <+>: jne 0x8048459 <foo_ifelse+> c += ;
0x0804844d <+>: movzx eax,BYTE PTR [ebp-0x4]
0x08048451 <+>: add eax,0x2
0x08048454 <+>: mov BYTE PTR [ebp-0x4],al
0x08048457 <+>: jmp 0x804847b <foo_ifelse+> } else if (c == 'A' || c == 'B') {
0x08048459 <+>: cmp BYTE PTR [ebp-0x4],0x41
0x0804845d <+>: je 0x8048465 <foo_ifelse+>
0x0804845f <+>: cmp BYTE PTR [ebp-0x4],0x42
0x08048463 <+>: jne 0x8048471 <foo_ifelse+> c += ;
0x08048465 <+>: movzx eax,BYTE PTR [ebp-0x4]
0x08048469 <+>: add eax,0x3
0x0804846c <+>: mov BYTE PTR [ebp-0x4],al
0x0804846f <+>: jmp 0x804847b <foo_ifelse+> } else {
c += ;
0x08048471 <+>: movzx eax,BYTE PTR [ebp-0x4]
0x08048475 <+>: add eax,0x4
0x08048478 <+>: mov BYTE PTR [ebp-0x4],al } return (c);
0x0804847b <+>: movsx eax,BYTE PTR [ebp-0x4] }
0x0804847f <+>: leave
0x08048480 <+>: ret End of assembler dump.
(gdb)
o 反汇编foo_switch()
(gdb) set disassembly-flavor intel
(gdb) disas /m foo_switch
Dump of assembler code for function foo_switch:
{
0x08048481 <+>: push ebp
0x08048482 <+>: mov ebp,esp
0x08048484 <+>: sub esp,0x4
0x08048487 <+>: mov eax,DWORD PTR [ebp+0x8]
0x0804848a <+>: mov BYTE PTR [ebp-0x4],al switch (c) {
0x0804848d <+>: movsx eax,BYTE PTR [ebp-0x4]
0x08048491 <+>: sub eax,0x30
0x08048494 <+>: cmp eax,0x32
0x08048497 <+>: ja 0x80484c6 <foo_switch+>
0x08048499 <+>: mov eax,DWORD PTR [eax*+0x80485f0]
0x080484a0 <+>: jmp eax case '':
case '': c += ; break;
0x080484a2 <+>: movzx eax,BYTE PTR [ebp-0x4]
0x080484a6 <+>: add eax,0x1
0x080484a9 <+>: mov BYTE PTR [ebp-0x4],al
0x080484ac <+>: jmp 0x80484d1 <foo_switch+> case 'b':
case 'a': c += ; break;
0x080484ae <+>: movzx eax,BYTE PTR [ebp-0x4]
0x080484b2 <+>: add eax,0x2
0x080484b5 <+>: mov BYTE PTR [ebp-0x4],al
0x080484b8 <+>: jmp 0x80484d1 <foo_switch+> case 'B':
case 'A': c += ; break;
0x080484ba <+>: movzx eax,BYTE PTR [ebp-0x4]
0x080484be <+>: add eax,0x3
0x080484c1 <+>: mov BYTE PTR [ebp-0x4],al
0x080484c4 <+>: jmp 0x80484d1 <foo_switch+> default: c += ; break;
0x080484c6 <+>: movzx eax,BYTE PTR [ebp-0x4]
0x080484ca <+>: add eax,0x4
0x080484cd <+>: mov BYTE PTR [ebp-0x4],al
0x080484d0 <+>: nop } return (c);
0x080484d1 <+>: movsx eax,BYTE PTR [ebp-0x4] }
0x080484d5 <+>: leave
0x080484d6 <+>: ret End of assembler dump.
(gdb)
分析:
(1)在foo_ifelse()中,采用的方法是按顺序比较,如满足条件,则执行对应的代码,否则跳转到下一个分支再进行比较;
(2)在foo_switch()中,下面的这段汇编代码比较有意思,
..
switch (c) {
0x0804848d <+>: movsx eax,BYTE PTR [ebp-0x4]
0x08048491 <+>: sub eax,0x30
0x08048494 <+>: cmp eax,0x32
0x08048497 <+>: ja 0x80484c6 <foo_switch+>
0x08048499 <+>: mov eax,DWORD PTR [eax*+0x80485f0]
0x080484a0 <+>: jmp eax
..
注意: 第17行 jmp eax
也就是说,当c的取值不同,是什么机制保证第17行能跳转到正确的位置开始执行呢?
第16行: eax = [eax * 4 + 0x80485f0]
搞清楚了从地址0x80485f0开始,对应的内存里面的内容也就回答了刚才的问题。
执行完第16行后,
当c为'1'或'0'时, eax的值应该是0x080484a2;
当c为'b'或'a'时, eax的值应该是0x080484ae;
当c为'B'或'A'时, eax的值应该是0x080484ba;
通过gdb查看对应的内存,确实如此!
>>> ord('') - 0x30 >>> ord('') - 0x30 (gdb) x /2wx *+0x80485f0
0x80485f0: 0x080484a2 0x080484a2 >>> ord('b') - 0x30 >>> ord('a') - 0x30 (gdb) x /2wx *+0x80485f0
0x80486b4: 0x080484ae 0x080484ae >>> ord('B') - 0x30 >>> ord('A') - 0x30 (gdb) x /2wx *+0x80485f0
0x8048634: 0x080484ba 0x080484ba
那么,我们可以大胆的猜测,虽然c的取值不同但是跳转的IP确实是精准无误的,一定是编译阶段就被设定好了,果真如此吗? 接下来分析一下对应的二进制文件foo,
第四步,使用objdump查看foo,
$ objdump -D foo > /tmp/x $ vim /tmp/x
509 Disassembly of section .rodata:
...
518 80485f0: a2 84 04 08 a2 mov %al,0xa2080484
519 80485f5: 84 04 08 test %al,(%eax,%ecx,1)
...
534 8048630: c6 84 04 08 ba 84 04 movb $0x8,0x484ba08(%esp,%eax,1)
535 8048637:
536 8048638: ba 84 04 08 c6 mov $0xc6080484,%edx
...
566 80486b0: c6 84 04 08 ae 84 04 movb $0x8,0x484ae08(%esp,%eax,1)
567 80486b7:
568 80486b8: ae scas %es:(%edi),%al
569 80486b9: 84 04 08 test %al,(%eax,%ecx,1)
...
在0x80485f0地址,存的8个字节正好是0x080484a2, 0x080484a2 (注意:按照小端的方式阅读)
在0x80486b4地址,存的8个字节正好是0x080484ae, 0x080484ae
在0x8048634地址,存的8个字节正好是0x080484ba,0x080484ba
果然不出所料,要跳转的IP的值正是在编译的时候存入了.rodata(只读数据区)。一旦foo开始运行,对应的内存地址就填写上了正确的待跳转地址,接下来只不过是根据c的取值计算出对应的IP存放的内存起始地址X,从X中取出待跳转的地址,直接跳转就好。
0x08048499 <+>: mov eax,DWORD PTR [eax*+0x80485f0]
0x080484a0 <+>: jmp eax
到此为止,我们已经搞清楚了为什么switch...case...语句相对于if...else if...else...来说执行效率要高的根本原因。简言之,编译的时候创建了一个map存于.rodata区中,运行的时候直接根据输入(c的值)查表,找到对应的IP后直接跳转。 (省去了cmp, jmp -> cmp, jmp -> cmp, jmp...这一冗长的计算过程。)
总结: switch...case...执行效率高,属于典型的以空间换时间。也就是说,(套用算法的行话)以提高空间复杂度为代价降低了时间复杂度。
为什么switch...case语句比if...else执行效率高的更多相关文章
-
为什么说在使用多条件判断时switch case语句比if语句效率高?
在学习JavaScript中的if控制语句和switch控制语句的时候,提到了使用多条件判断时switch case语句比if语句效率高,但是身为小白的我并没有在代码中看出有什么不同.去度娘找了半个小 ...
-
java中的Switch case语句
java中的Switch case 语句 在Switch语句中有4个关键字:switch,case break,default. 在switch(变量),变量只能是整型或者字符型,程序先读出这个变量的 ...
-
switch… case 语句的用法
switch… case 语句的用法 public class Test7 { public static void main(String[] args) { int i=5; switch(i ...
-
if语句,if...else if语句和switch...case语句的区别和分析
前段时间在工作中遇到了一个关于条件判断语句的问题,在if语句,if else if语句和switch case语句这三者之间分析,使用其中最有效率的一种方法. 所以就将这个问题作为自己第一篇博客的主要 ...
-
JavaScript基础知识(if、if else、else if、while、switch...case语句)
13.语句 概念:就是分号(:) 代表一条语句的结束 习惯:一行只编写一条语句:一行编写多条语句(代码可读性较差) 语句块:可以包含多条语句 "{ }"将多条语句包裹 u ...
-
Java基础之循环语句、条件语句、switch case 语句
Java 循环结构 - for, while 及 do...while 顺序结构的程序语句只能被执行一次.如果您想要同样的操作执行多次,,就需要使用循环结构. Java中有三种主要的循环结构: whi ...
-
JavaSE基础(七)--Java流程控制语句之switch case 语句
Java switch case 语句 switch case 语句判断一个变量与一系列值中某个值是否相等,每个值称为一个分支. 语法 switch case 语句语法格式如下: switch(exp ...
-
逆向知识第九讲,switch case语句在汇编中表达的方式
一丶Switch Case语句在汇编中的第一种表达方式 (引导性跳转表) 第一种表达方式生成条件: case 个数偏少,那么汇编中将会生成引导性的跳转表,会做出 if else的情况(类似,但还是能分 ...
-
Java switch case 语句
switch case 语句判断一个变量与一系列值中某个值是否相等,每个值称为一个分支. 语法 switch(expression){ case value : //语句 break; //可选 ca ...
随机推荐
-
下载Orchard源码
下载地址:http://orchardproject.net/download
-
充分利用 SQL Server Reporting Services 图表
最近在查SSRS的一些文章,看到MSDN在有一篇不错的文章,许多图表设置都有说明,共享给大家.. 其中有说明在SSRS中如果去写条件表达写和报表属性中的“自定义代码”,文章相对比较长,需要大家耐心的查 ...
-
sqlite3移植到arm linux
1,环境: 软件:linux:2.6.38 硬件:6410 交叉编译工具:arm-linux-gcc 也适用于其他linux平台. 2,步骤: 1>下载sqlite3源码包: http://ww ...
-
HNOI2004打鼹鼠(LIS)
大水题…… 不过通过这题我们应该养成一个好习惯:好好看清题…… 竟然没有看到时限 10sec…… var i,j,n,m,ans:longint; f,time,x,y:..] of longint; ...
-
HDU --2665
Kth number Time Limit: 15000/5000 MS (Java/Others) Memory Limit: 32768/32768 K (Java/Others)Total ...
-
Magento资源问题上CDN方案研究
通过对Magento的了解,发现Magento的资源文件主要分布在media.js.skin三个文件夹里,media文件夹主要包括了系统自带编辑器WYSIWYG Editor 所有编辑器涉及到的资源( ...
-
send js object to webapi or mvc
[HttpPost] public HttpResponseMessage AddInfo(UserInfoEntity userInfo) { return Request.CreateRespon ...
-
学而精计算机公共基础学习之路TEST1
算法 一:算法基本概念 算法是个什么概念学了这么久的程序尽然没有听说过,其实算法就是为了解决问题那么怎么准确完整的解决这个问题就是算法.所以我们所写的程序就可以说为对算法的描述,但是程序编制是不能有于 ...
-
C++中不同变量、函数在内存中的内存情况《转》
一.一个C++编译的程序占用的内存分为以下几个部分 1.栈区:由编译器自动分配 存放函数的参数值,局部变量的值等,操作方式类似于数据结构中的栈. 2.堆区:一般由程序员分配释放,若程序员不释放,程序结 ...
-
STM32 BOR/POR/PDR介绍
以STM32为例,介绍单片机中的BOR/POR/PDR1)PVD = Programmable Votage Detector 可编程电压监测器 它的作用是监视供电电压,在供电电压下降到给定的阀值以下 ...