CSAPP lab2 二进制拆弹 binary bombs phase_5

时间:2023-11-14 11:21:20

给出对应于7个阶段的7篇博客

phase_1  https://www.cnblogs.com/wkfvawl/p/10632044.html
phase_2  https://www.cnblogs.com/wkfvawl/p/10636214.html
phase_3  https://www.cnblogs.com/wkfvawl/p/10651205.html
phase_4  https://www.cnblogs.com/wkfvawl/p/10672680.html
phase_5  https://www.cnblogs.com/wkfvawl/p/10703941.html
phase_6  https://www.cnblogs.com/wkfvawl/p/10742405.html
secret_phase  https://www.cnblogs.com/wkfvawl/p/10745307.html

phase_5

phase_5要求输入一个包含6个字符的字符串。phase_5函数从中读取这些信息,并判断其正确性,如果不正确,则炸弹爆炸。

phase_5主要考察学生对指针(数组)机器级表示的掌握程度。

观察框架源文件bomb.c:

CSAPP lab2 二进制拆弹 binary bombs phase_5

从上可以看出:

1、首先调用了read_line()函数,用于输入炸弹秘钥,输入放置在char* input中。

2、调用phase_5函数,输入参数即为input,可以初步判断,phase_5函数将输入的input字符串作为参数。

因此下一步的主要任务是从asm.txt中查找在哪个地方调用了readline函数以及phase_5函数。

1.1 寻找并分析调用phase_5函数的代码

打开asm.txt,寻找phase_5函数。

CSAPP lab2 二进制拆弹 binary bombs phase_5

和phase_1类似分析:

1、当前栈的位置存放的是read_line函数读入的一串输入;

2、phase_5的函数入口地址为0x8048df7

此时的函数栈为:

CSAPP lab2 二进制拆弹 binary bombs phase_5

1.2 phase_5函数分析

继续寻找phase_5,或搜索8048df7,可以找到phase_5函数入口。如下图所示:

CSAPP lab2 二进制拆弹 binary bombs phase_5

1、541-547行:初始化函数栈帧,并为调用string_length做准备(此时ebx的内容为input字符串首地址:543行)。函数栈帧如下图所示:

CSAPP lab2 二进制拆弹 binary bombs phase_5

注:

1)544-545行:mov %gs:0x14, %eax   mov %eax, 0x1c(%esp),将gs(全局段寄存器)+0x14偏移位置的内容放置到eax,然后将其放置到esp + 0x1c的地方。从这里看不出这段代码什么含义,但据后面的分析,这里应该是起到一个“哨兵”的作用,防止数组访问越界。

2)546行:xor %eax, %eax,似乎没有什么用,得出来的结果是0,应该只是影响zf标志寄存器(zf为零标志寄存器,即zf=1)。

2、548行:判断input字符串的长度(esp指向的地方为input的首地址,参见上图),返回结果在eax寄存器中。

3、549-551行:判断input的长度是否为6,如果不是,则炸弹爆炸(551行),如果是,跳转到8048e62<phase_5+0x6b>。也即输入的字符串长度应该是6。

4、572-573行(8048e62<phase_5+0x6b>):将eax寄存器内容赋值为0,然后跳转到8048e22<phase_5+0x2b>。

5、554行(<8048e22><phase_5+0x2b>):将ebx + eax * 1地址的内容送入到edx。注意, ebx为input首地址,也即将input[%eax]的内容送入到edx。当eax = 0时,即为edx的内容为input[0]。

6、555行:将edx的内容(input[0])与0x0f位与,相当于取低4位(edx内容为input[eax]的低四位)。

7、556行:将edx + 0x804a470指向的地址的内容送入到edx。0x804a470的内容(使用objdump --start-address=0x804a470  -s bomb,参见phase_1分析过程)为:

CSAPP lab2 二进制拆弹 binary bombs phase_5

从上面来看,0x804a470应该是指向一个字符串,此时edx的内容应该是0x804a470加上input[eax]低4位的偏移的内容。

8、557行:将dl(edx的低8位,为(0x804a470 +input[eax]) & 0xf)的内容送入到esp + eax * 1 + 0x15的地方。

9、558-560行:eax += 1,然后判断eax的内容是否等于6,如果不等,则跳转到8048e22<phase_5+0x2b>,重新回到第5步继续进行分析,直到eax=6(即循环6次)。

10、以上代码,以类c语言来简要说明:

for(int i = 0; i < 6; i++){

//将0x804a470 +  input[i] & 0x0f这个地址的内容送入到堆栈esp + i + 0x15地址中。

(0x804a470 +  input[i] & 0x0f)  --> (esp + i + 0x15)

}

经过6次循环后,函数栈帧如下:

CSAPP lab2 二进制拆弹 binary bombs phase_5

显然,从esb + 0x15开始,是根据input的输入的每个字符的低四位,得出来的一个新的字符串。

11、561行:以上循环结束后,跳出循环,执行该语句:esp + 0x1b的内容改变为0;

12、562行:将0x804a446送入到:esp+0x4。0x804a446的内容为(objdump --start-address=0x804a446 -s bomb):

CSAPP lab2 二进制拆弹 binary bombs phase_5

也即当前esp+0x4指向的是一个字符串首地址,字符串为“sabres”

13、564-565行:eax的内容变为esp + 0x15,即通过上面循环形成的新的字符串的首地址,然后将其送入到esp。

14、调用strings_not_equal函数,显然,前面11~13均在为调用strings_not_equal做准备,调用strings_not_equal前,函数栈帧为:

CSAPP lab2 二进制拆弹 binary bombs phase_5

15、显然,strings_not_equal函数判断以(esp + 0x15)为首地址的字符串与0x804a446为首地址的字符串(sabres)相比较,如相等,eax返回0,如不相等eax返回1。(参见phase_1分析)

16、567行:判断eax是否为0(eax与eax位与),如果为0,0标志寄存器为1。

17、568-569行:如果eax=0,则跳转到8048e69<phase_5+0x72>,后续直接退出phase_5了,说明输入的input字符串是正确的,否则引爆炸弹。(8048e69<phase_5+0x72>代码后面分析)

18、574-577行:将esp + 0x1c地址处的内容送入到eax(574行,esp+0x1c的内容应为%gs:0x14的内容),然后与%gs:0x14的内容相异或,如果相等(为0),则跳转到0x8048e7b,正常结束,否则调用__stack_chk_fail函数(应该是栈检查失败);

根据上面分析,%gs:0x14的值送入到esp+0x1c的地方(第544-545行),应该是起到一个“哨兵”的作用,防止数组的访问越界。

1.3 phase_5结果分析

根据前面分析,显然phase_5函数的作用(以类C语言进行描述):

char array[] = {'m','a','d','u','i','e','r','s','n','f','o','t','v','b','y','l'};
char *str = "sabres";
char new_str[];
//根据input的每个字符的低4位,以及array,形成新的字符串。
for(int i = ; i < ; i ++)
{
new_str[i] = array[input[i]&0xf]);
}
new_str[] ='\0';
//如果new_str不等于str("sabres"),则引爆炸弹。
if(strcmp(str, new_str) !=)
{
explode_bomb();
}

那么根据上面的代码反推,如果需要使构成的new_str=="sabres",那么输入的input[i]的低4位对应的十进制数分别是array[]数组中字符's','a','b','r','e','s'的下标。

根据以上分析,要形成"sabres"字符串:

array[] = {'m', 'a', 'd', 'u', 'i', 'e', 'r', 's', 'n', 'f', 'o', 't', 'v', 'b', 'y', 'l '};

1)'s':对应于array第7个 (从0开始),也即input[0]的低4位应该为7,符合条件的可显示字符有:''','7 ','G','W','g','w'(参见附后的ASCII码表):

2)'a':对应于array第1个 (从0开始),也即input[1]的低4位应该为2,符合条件的可显示字符有:'!','1 ','A','Q',a','q'

3)'b':对应于array第13个(从0开始),也即input[2]的低4位应该为13,符合条件的可显示字符有:'-','=','M',']','m', '}'

4)'r':对应于array第6个 (从0开始),也即input[3]的低4位应该为6,符合条件的可显示字符有:'&','6 ','F','V','f','v'

5)'e':对应于array第5个 (从0开始),也即input[4]的低4位应该为5,符合条件的可显示字符有:'%','5','E','U','e','u'

6)'s':对应于array第7个 (从0开始),也即input[5]的低4位应该为7,符合条件的可显示字符有:''','7 ','G','W','g','w'

CSAPP lab2 二进制拆弹 binary bombs phase_5

因此,对于本题,答案不是唯一的,为6组可选字符的排列组合,如"gamfeg"、"GAMFEG"等。