学习ARM反汇编工具objdump和一个简单实例

时间:2022-03-14 19:41:44

学习ARM反汇编工具objdump和一个简单实例

                                                                         --参考朱有鹏ARM裸机编程


1、反汇编的原理&为什么需要反汇编
arm-linux-objdump -D led.elf > led_elf.dis
objdump是gcc工具链中的反汇编工具,作用是由编译链接好的elf
格式的可执行程序,来反过来得到汇编源代码。

-D表示反汇编。

>左边的是ELF的可执行程序(反汇编时候的原材料)
>右边的是反汇编生成的反汇编程序。其实就是一个汇编语言。


一般情况下我们写一个源代码

类似于我们WINDOW里面是EXE的格式,PE格式是官方的名字。


2、为什么我们需要进行反汇编,我们要的就是可执行程序。

反汇编的原因有以下:
1、逆向破解
你想盗版的原来的程序,最终得到程序的源代码。
2、调式程序的时候,反汇编代码可以帮助我们理解程序。

(我们学习时使用objdump主要目的是这个),
尤其是在理解链接脚本,链接地址等概念时候。
尤其是在理解链接的时候,用反汇编对你的理解非常大。


如果你是C语言写的源代码,反汇编之后得到的汇编语言的源代码,

可以有助于你理解C和汇编之间的关系,
非常有助于理解深入理解C语言。

3、反汇编文件的分析:

(1)第一个是标号比如000000这些是代表当前的地址

(2)第二个标号比如e59f0050:代表的是机器码的意思,其实我们写的所有的可执行程序都是机器码

只不过汇编语言就是相当于一句汇编语言对应一个机器码,这样我们编程就不用像以前那么辛苦了。

  0:	e59f0050 	ldr	r0, [pc, #80]	; 58 <delay_loop+0x10>
这句话是 ldr r0, =0x11111111 // 从后面的=可以看出用的是ldr伪指令,因为需要编译器来判断这个数

编译器翻译出来就是上面的一句话,0x11111111这个数是ARM伪指令提供的。

那么到底机器把这句话放置在哪里呢?

把这句话放置在58这个地址中,后面已经有注释了:

再往下看58地址中,可以看到显示11111111


led.elf:     file format elf32-littlearm


Disassembly of section .text:

00000000 <_start>:
   0:	e59f0050 	ldr	r0, [pc, #80]	; 58 <delay_loop+0x10>
   4:	e59f1050 	ldr	r1, [pc, #80]	; 5c <delay_loop+0x14>
   8:	e5810000 	str	r0, [r1]

0000000c <flash>:
   c:	e3e00008 	mvn	r0, #8
  10:	e59f1048 	ldr	r1, [pc, #72]	; 60 <delay_loop+0x18>
  14:	e5810000 	str	r0, [r1]
  18:	eb000008 	bl	40 <delay>
  1c:	e3e00010 	mvn	r0, #16
  20:	e59f1038 	ldr	r1, [pc, #56]	; 60 <delay_loop+0x18>
  24:	e5810000 	str	r0, [r1]
  28:	eb000004 	bl	40 <delay>
  2c:	e3e00020 	mvn	r0, #32
  30:	e59f1028 	ldr	r1, [pc, #40]	; 60 <delay_loop+0x18>
  34:	e5810000 	str	r0, [r1]
  38:	eb000000 	bl	40 <delay>
  3c:	eafffff2 	b	c <flash>

00000040 <delay>:
  40:	e59f201c 	ldr	r2, [pc, #28]	; 64 <delay_loop+0x1c>
  44:	e3a03000 	mov	r3, #0

00000048 <delay_loop>:
  48:	e2422001 	sub	r2, r2, #1
  4c:	e1520003 	cmp	r2, r3
  50:	1afffffc 	bne	48 <delay_loop>
  54:	e1a0f00e 	mov	pc, lr
  58:	11111111 	tstne	r1, r1, lsl r1
  5c:	e0200240 	eor	r0, r0, r0, asr #4
  60:	e0200244 	eor	r0, r0, r4, asr #4
  64:	00895440 	addeq	r5, r9, r0, asr #8

Disassembly of section .ARM.attributes:

00000000 <.ARM.attributes>:
   0:	00001a41 	andeq	r1, r0, r1, asr #20
   4:	61656100 	cmnvs	r5, r0, lsl #2
   8:	01006962 	tsteq	r0, r2, ror #18
   c:	00000010 	andeq	r0, r0, r0, lsl r0
  10:	45543505 	ldrbmi	r3, [r4, #-1285]	; 0x505
  14:	08040600 	stmdaeq	r4, {r9, sl}
  18:	Address 0x00000018 is out of bounds.


4、反汇编文件的格式和看法


标号地址、标号名字、指令地址、指令机器码
指令机器码反汇编到的指令

扩展:ARM汇编中用地址池的方式实现非法立即数。

指令和地址是一一对应的,
我们下载烧录的bin文件,内部其实就是
一条一条的指令机器码,这些指令每一条都有一个指令地址。
这个地址是连接的ld给根据我们写的链接脚本来指定的。


-Ttext  :指定我们的起始地址的。

所有的地址都从别的地址开始执行,根据你的地址来执行。



5、展望:反汇编工具帮助我们分析链接脚本


反汇编的时候得到的地址是链接器考虑了链接脚本之后得到的地址,而
我们写代码是通过指定链接脚本来让链接器给我们链接合适的地址。


但是有时候我们写的链接脚本有误,或者我们不知道
这个链接脚本会怎么样?


这时候可以通过看反汇编文件分析这个链接脚本的效果。
看是不是我们想要的,如果不是的话可以改了再看。