http://hi.baidu.com/ssiss001/blog/item/c0ee8ed1ce11b6d6572c848d.html
在开发嵌入式系统时,调试往往是一大难题。面试过不少嵌入式linux工程师,当问及调试手段时,他们的调试手段一般是两种:首先是在PC上的模拟环境中运行,若有问题,可以很方便的调试。其次,若在板子上运行时才出错,就用printf输出log信息,根据log信息定位错误。有少部分人用gdbserver调试板子上的程序,但问到如何在共享库里设置断点时,都说没有办法。 去年,Tinyx的一个内存越界BUG,花了我2天时间。gcc的一个浮点数BUG让我查了3天时间。这类BUG在PC上根本重现不了,在板子上用printf要花费大量的时间才能把错误的范围缩小一点。后来想了想,与其花时间去加printf,还不如把gdbserver调试共享库的问题解决了,可以为以后的调试节省不少时间。 在网上找了半天资料,没有什么收获,看来只好自己动手研究。花了一个周末的时间去研究gdbserver的运行方式。办法是找到了,不过仍然有点麻烦,等有时间了,修改一下gdb的代码,把这个过程自动化了。 先调试运行gdbserver,对gdbserver有了一些感性认识,然后研究linux-low.c中的代码。原来,设置断点只是在对应的内存中写入断点指令(x86上为0xcc)。 gdbserver为什么不能在共享库中设置断点呢?设置断点只是写内存,调试时,所有的代码段都是可写的,在exe中可以设置断点,没有理由不让在共享库中设置啊。所以这应该与是否是共享库关系不大。 猜测可能是符号与地址对应关系有误,如果你的本意为function1设置断点,结果gdb搞错了,设置一个毫不相干的地方,可能永远都不会执行到那里,这个断点自然没什么效果。 如果是这样,有两种方法可以解决:要么手动计算符号的地址,再设置断点,当然这样太累。另外就让gdb自动对应起来。经过反得尝试,用下列方法可以在共享库中设置断点,虽然有点麻烦,还是可行的。 1. 准备工作,编写下面几个文件: test.c: #include <stdlib.h> int test(int a, int b) { int s = a + b; printf("%d/n", s); return s; } main.c: #include <stdlib.h> extern int test(int a, int b); int main(int argc, char* argv[]) { int s = test(10, 20); return s; } Makefile: all: so main so: gcc -g test.c -shared -o libtest.so main: gcc -g main.c -L./ -ltest -o test.exe clean: rm -f *.exe *.so (为了便于演示,整个过程在PC上测试,后来证实在实验板上能够正常工作) 2. 编译并设置环境变量 make export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:./ 3. 运行gdbserver gdbserver localhost:2000 ./test.exe 4. 运行gdb客户端 gdb symbol-file test.exe target remote localhost:2000 b main c 5. 查看libtest.so的代码在内存中的位置。 (从gdbserver的输出或者用ps可以得到test.exe的进程ID,这里假设PID是11547) cat /proc/11547/maps 输出: 00624000-0063e000 r-xp 00000000 03:01 718192 /lib/ld-2.3.5.so 0063e000-0063f000 r-xp 00019000 03:01 718192 /lib/ld-2.3.5.so 0063f000-00640000 rwxp 0001a000 03:01 718192 /lib/ld-2.3.5.so 00642000-00766000 r-xp 00000000 03:01 718193 /lib/libc-2.3.5.so 00766000-00768000 r-xp 00124000 03:01 718193 /lib/libc-2.3.5.so 00768000-0076a000 rwxp 00126000 03:01 718193 /lib/libc-2.3.5.so 0076a000-0076c000 rwxp 0076a000 00:00 0 00bbe000-00bbf000 r-xp 00bbe000 00:00 0 00fcc000-00fcd000 r-xp 00000000 03:01 1238761 /root/test/gdbservertest/libtest.so 00fcd000-00fce000 rwxp 00000000 03:01 1238761 /root/test/gdbservertest/libtest.so 08048000-08049000 r-xp 00000000 03:01 1238765 /root/test/gdbservertest/test.exe 08049000-0804a000 rw-p 00000000 03:01 1238765 /root/test/gdbservertest/test.exe b7f8a000-b7f8b000 rw-p b7f8a000 00:00 0 b7f99000-b7f9a000 rw-p b7f99000 00:00 0 bfd85000-bfd9a000 rw-p bfd85000 00:00 0 [stack] 由此可以知道:libtest.so的代码在00fcc000-00fcd000之间。 6. 查看libtest.so的.text段在内存中的偏移位置: objdump -h libtest.so |grep .text 输出: 9 .text 00000130 00000450 00000450 00000450 2**4 即偏移位置为0x00000450 7. 回到gdb窗口,加载libtest.so的符号表。 add-symbol-file libtest.so 0x00fcc450 (这里0x00fcc450 = 0x00fcc000 + 0x00000450) 8. 在共享库的函数中设置断点。 b test 9. 继续调试,可以发现在共享库中设置的断点,能够正常工作。