随想录(kgdb的基本原理)

时间:2021-11-28 03:40:49

【 声明:版权所有,欢迎转载,请勿用于商业用途。 联系信箱:feixiaoxing @163.com】


    在linux kernel调试的时候,有一种很方便的调试方法,那就是kgdb。kgdb的本质,就是在kernel内部建立一个gdb server,通过串口,它就可以和gdb进行通信来调试了。kgdb的代码和kernel是独立开来的,也就是说,除了极少数的情况,kgdb不会调用kernel的函数。这样就保证kgdb可以任意在kernel中设置断点进行调试。


1、gdb调试


    gdb调试时kgdb的基础。一般来说,我们怎么用gdb调试呢,如下所示


shell> gcc hello.c -g -o hello

shell> gdb hello


    编译的时候,一般先添加-g选项。添加这个选项的好处是什么,那就是在编译的时候会在执行文件中添加调试信息。有了这些调试信息之后,查看变量、设置函数断点都非常方便。因为关于函数地址、变量地址的相关信息都保存在了调试信息当中。

    那么如果没有-g选项,能不能调试呢,其实也是可以的,


shell> gcc hello.c -o hello

shell> gdb hello


    没有-g本身并不会影响调试,只是gdb种的部分选项无法使用而已。这时候调试,一般需要把执行文件反汇编处理,利用地址和阅读汇编语言的方法进行调试和分析。


2、gdb server & gdb


    对于嵌入式来说,硬件本身的性能决定了很多软件不能运行在嵌入式设备上。这个时候,人们就想出来了gdb server的方法。gdb server就相当于一个服务器,它接受pc 上gdb的命令,将gdb要做的动作做完,并反馈相应的结果就可以了。


shell> gdbserver ./hello :7070

shell> gdb ./hello

gdb> target remote 127.0.0.1:7070


    上面的demo是为了说明gdb server的用法,在实际使用的使用,只需要将ip设置成对应的嵌入式设备ip就可以了。那么,如果gdb想要调试一个嵌入式板子上正在运行的程序怎么办?也不难,


shell> gdbserver :7070 --attach 12345

shell> gdb

gdb> target remote 127.0.0.1:7070


    修改的方法就是在gdbserver运行的时候添加一个attach的编译选型就可以了。


3、kdgb


    有一本书籍叫《软件调试》的,内容非常好,它主要就是讲软件调试基本原理的。一般来说,软件调试离不开cpu、操作系统、编译器和gdb等调试软件的帮助。cpu决定了什么指令本身会产生中断、操作系统帮助我们收集被调试程序的所有信息、编译器产生调试信息、gdb则完成调试者和系统的交互工作。前面,我们谈到了gdb server& gdb,这里的kgdb完成的就是gdb server的工作。kgdb的使用其实非常简单,


a、打开kernel下面的kgdb调试开关

b、修改kernel启动参数

c、打开gdb命令,设置target选项,完成和gdb的沟通工作,准备开始调试


    关于上面kgdb的详细操作,可以参考这一篇文章。 那kgdb本身是怎么完成的,大家可以参考kernel/debug下的代码,比如,kernel本身最早是在2.6.35才正式引入kgdb的。之前kgdb都只能作为patch自己添加到kerne里面,十分不方便。


    整个目录下面,最重要的文件就是debug_core.c和gdbstub.c两个文件。中间主要包括了两个流程,

a、设置断点的流程,在debug_core.c中有如下的代码

early_param("kgdbwait", opt_kgdb_wait);

,它说明了opt_kgdb_wait是在什么时候调用的。事实上,这个函数最重要的设计就是调用arch_kgdb_breakpoint,人为产生一个断点,让cpu进入异常,从而可以让kdgb可以与gdb进行交互处理。


b、处理异常

intkgdb_handle_exception(int evector, int signo, int ecode, struct pt_regs *regs){struct kgdb_state kgdb_var;struct kgdb_state *ks = &kgdb_var;int ret;ks->cpu= raw_smp_processor_id();ks->ex_vector= evector;ks->signo= signo;ks->err_code= ecode;ks->kgdb_usethreadid= 0;ks->linux_regs= regs;if (kgdb_reenter_check(ks))return 0; /* Ouch, double exception ! */kgdb_info[ks->cpu].exception_state |= DCPU_WANT_MASTER;ret = kgdb_cpu_enter(ks, regs);kgdb_info[ks->cpu].exception_state &= ~(DCPU_WANT_MASTER |DCPU_IS_SLAVE);return ret;}

    这段代码就是kgdb异常的入口点。从kgdb_handle_exception-> kgdb_cpu_enter-> gdb_serial_stub函数,一条龙完成kgdb交互之前的准备工作,gdb_serial_stub函数如下所示,


/* * This function performs all gdbserial command procesing */int gdb_serial_stub(struct kgdb_state *ks){int error = 0;int tmp;/* Clear the out buffer. */memset(remcom_out_buffer, 0, sizeof(remcom_out_buffer));if (kgdb_connected) {unsigned char thref[8];char *ptr;/* Reply to host that an exception has occurred */ptr = remcom_out_buffer;*ptr++ = 'T';ptr = pack_hex_byte(ptr, ks->signo);ptr += strlen(strcpy(ptr, "thread:"));int_to_threadref(thref, shadow_pid(current->pid));ptr = pack_threadid(ptr, thref);*ptr++ = ';';put_packet(remcom_out_buffer);}kgdb_usethread = kgdb_info[ks->cpu].task;ks->kgdb_usethreadid = shadow_pid(kgdb_info[ks->cpu].task->pid);ks->pass_exception = 0;while (1) {error = 0;/* Clear the out buffer. */memset(remcom_out_buffer, 0, sizeof(remcom_out_buffer));get_packet(remcom_in_buffer);switch (remcom_in_buffer[0]) {case '?': /* gdbserial status */gdb_cmd_status(ks);break;case 'g': /* return the value of the CPU registers */gdb_cmd_getregs(ks);break;case 'G': /* set the value of the CPU registers - return OK */gdb_cmd_setregs(ks);break;case 'm': /* mAA..AA,LLLL  Read LLLL bytes at address AA..AA */gdb_cmd_memread(ks);break;case 'M': /* MAA..AA,LLLL: Write LLLL bytes at address AA..AA */gdb_cmd_memwrite(ks);break;case 'X': /* XAA..AA,LLLL: Write LLLL bytes at address AA..AA */gdb_cmd_binwrite(ks);break;/* kill or detach. KGDB should treat this like a * continue. */case 'D': /* Debugger detach */case 'k': /* Debugger detach via kill */gdb_cmd_detachkill(ks);goto default_handle;case 'R': /* Reboot */if (gdb_cmd_reboot(ks))goto default_handle;break;case 'q': /* query command */gdb_cmd_query(ks);break;case 'H': /* task related */gdb_cmd_task(ks);break;case 'T': /* Query thread status */gdb_cmd_thread(ks);break;case 'z': /* Break point remove */case 'Z': /* Break point set */gdb_cmd_break(ks);break;#ifdef CONFIG_KGDB_KDBcase '3': /* Escape into back into kdb */if (remcom_in_buffer[1] == '\0') {gdb_cmd_detachkill(ks);return DBG_PASS_EVENT;}#endifcase 'C': /* Exception passing */tmp = gdb_cmd_exception_pass(ks);if (tmp > 0)goto default_handle;if (tmp == 0)break;/* Fall through on tmp < 0 */case 'c': /* Continue packet */case 's': /* Single step packet */if (kgdb_contthread && kgdb_contthread != current) {/* Can't switch threads in kgdb */error_packet(remcom_out_buffer, -EINVAL);break;}dbg_activate_sw_breakpoints();/* Fall through to default processing */default:default_handle:error = kgdb_arch_handle_exception(ks->ex_vector,ks->signo,ks->err_code,remcom_in_buffer,remcom_out_buffer,ks->linux_regs);/* * Leave cmd processing on error, detach, * kill, continue, or single step. */if (error >= 0 || remcom_in_buffer[0] == 'D' ||    remcom_in_buffer[0] == 'k') {error = 0;goto kgdb_exit;}}/* reply to the request */put_packet(remcom_out_buffer);}kgdb_exit:if (ks->pass_exception)error = 1;return error;}

    当然,除了第一次交互是人为设置断点之外,后面的断点主要是依靠kgdb的命令设置来完成的。在交互模式下,你可以完成很多操作,比如查看内存、寄存器、设置断点,甚至可以扩展kgdb的功能都可以。目前kgdb支持最好的是x86 cpu,其他cpu只是完成gdb server的一些基本工作而已。