Linux下使用gdb进行单步调试(三)

时间:2022-08-01 16:43:44

转自:http://blog.****.net/cnctloveyu/article/details/4266702   

http://hi.baidu.com/hust_chen/blog/item/64f3ad458b690b85b2b7dcf0.html

四、源代码的内存

你可以使用 info line 命令来查看源代码在内存中的地址。 info line 后面可以跟 “ 行号 ” , “ 函数名 ” , “ 文件名 : 行号 ” , “ 文件名 : 函数名 ” ,这个命令会打印出所指定的源码在运行时的内存地址,如:

        (gdb) info line tst.c:func
        Line 5 of "tst.c" starts at address 0x8048456 <func+6> and ends at 0x804845d <func+13>.

还有一个命令( disassemble )你可以查看源程序的当前执行时的机器码,这个命令会把目前内存中的指令 dump 出来。如下面的示例表示查看函数 func 的汇编代码。

        (gdb) disassemble func
        Dump of assembler code for function func:
        0x8048450 <func>:       push   %ebp
        0x8048451 <func+1>:     mov    %esp,%ebp
        0x8048453 <func+3>:     sub    $0x18,%esp
        0x8048456 <func+6>:     movl   $0x0,0xfffffffc(%ebp)
        0x804845d <func+13>:    movl   $0x1,0xfffffff8(%ebp)
        0x8048464 <func+20>:    mov    0xfffffff8(%ebp),%eax
        0x8048467 <func+23>:    cmp    0x8(%ebp),%eax
        0x804846a <func+26>:    jle    0x8048470 <func+32>
        0x804846c <func+28>:    jmp    0x8048480 <func+48>
        0x804846e <func+30>:    mov    %esi,%esi
        0x8048470 <func+32>:    mov    0xfffffff8(%ebp),%eax
        0x8048473 <func+35>:    add    %eax,0xfffffffc(%ebp)
        0x8048476 <func+38>:    incl   0xfffffff8(%ebp)
        0x8048479 <func+41>:    jmp    0x8048464 <func+20>
        0x804847b <func+43>:    nop
        0x804847c <func+44>:    lea    0x0(%esi,1),%esi
        0x8048480 <func+48>:    mov    0xfffffffc(%ebp),%edx
        0x8048483 <func+51>:    mov    %edx,%eax
        0x8048485 <func+53>:    jmp    0x8048487 <func+55>
        0x8048487 <func+55>:    mov    %ebp,%esp
        0x8048489 <func+57>:    pop    %ebp
        0x804848a <func+58>:    ret
        End of assembler dump.

查看运行时数据
———————
   
    在你调试程序时,当程序被停住时,你可以使用 print 命令(简写命令为 p ),或是同义命令 inspect 来查看当前程序的运行数据。 print 命令的格式是:
   
    print <expr>
    print /<f> <expr>
        <expr> 是表达式,是你所调试的程序的语言的表达式( GDB 可以调试多种编程语言), <f> 是输出的格式,比如,如果要把表达式按 16 进制的格式输出,那么就是 /x 。
       
   
一、表达式

    print 和许多 GDB 的命令一样,可以接受一个表达式, GDB 会根据当前的程序运行的数据来计算这个表达式,既然是表达式,那么就可以是当前程序运行中的 const 常量、变量、函数等内容。可惜的是 GDB 不能使用你在程序中所定义的宏。
   
    表达式的语法应该是当前所调试的语言的语法,由于 C/C++ 是一种大众型的语言,所以,本文中的例子都是关于 C/C++ 的。(而关于用 GDB 调试其它语言的章节,我将在后面介绍)
   
    在表达式中,有几种 GDB 所支持的操作符,它们可以用在任何一种语言中。
   
    @
        是一个和数组有关的操作符,在后面会有更详细的说明。
       
    ::
        指定一个在文件或是一个函数中的变量。
       
    {<type>} <addr>
        表示一个指向内存地址 <addr> 的类型为 type 的一个对象。
       
       
二、程序变量

    在 GDB 中,你可以随时查看以下三种变量的值:
        1 、全局变量(所有文件可见的)
        2 、静态全局变量(当前文件可见的)
        3 、局部变量(当前 Scope 可见的)
       
    如果你的局部变量和全局变量发生冲突(也就是重名),一般情况下是局部变量会隐藏全局变量,也就是说,如果一个全局变量和一个函数中的局部变量同名时,如 果当前停止点在函数中,用 print 显示出的变量的值会是函数中的局部变量的值。如果此时你想查看全局变量的值时,你可以使用 “ :: ” 操作符:
   
        file::variable
    function::variable
    可以通过这种形式指定你所想查看的变量,是哪个文件中的或是哪个函数中的。例如,查看文件 f2.c 中的全局变量 x 的值:
   
    gdb) p 'f2.c'::x
   
    当然, “ :: ” 操作符会和 C++ 中的发生冲突, GDB 能自动识别 “ :: ” 是否 C++ 的操作符,所以你不必担心在调试 C++ 程序时会出现异常。
   
    另外,需要注意的是,如果你的程序编译时开启了优化选项,那么在用 GDB 调试被优化过的程序时,可能会发生某些变量不能访问,或是取值错误码的情况。这个是很正常的,因为优化程序会删改你的程序,整理你程序的语句顺序,剔除一 些无意义的变量等,所以在 GDB 调试这种程序时,运行时的指令和你所编写指令就有不一样,也就会出现你所想象不到的结果。对付这种情况时,需要在编译程序时关闭编译优化。一般来说,几乎 所有的编译器都支持编译优化的开关,例如, GNU 的 C/C++ 编译器 GCC ,你可以使用 “ -gstabs ” 选项来解决这个问题。关于编译器的参数,还请查看编译器的使用说明文档。
   

三、数组

    有时候,你需要查看一段连续的内存空间的值。比如数组的一段,或是动态分配的数据的大小。你可以使用 GDB 的 “ @ ” 操作符, “ @ ” 的左边是第一个内存的地址的值, “ @ ” 的右边则你你想查看内存的长度。例如,你的程序中有这样的语句:
    
        int *array = (int *) malloc (len * sizeof (int));
       
    于是,在 GDB 调试过程中,你可以以如下命令显示出这个动态数组的取值:

        p *array@len

    @ 的左边是数组的首地址的值,也就是变量 array 所指向的内容,右边则是数据的长度,其保存在变量 len 中,其输出结果,大约是下面这个样子的:
   
        (gdb) p *array@len
        $1 = {2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40}

    如果是静态数组的话,可以直接用 print 数组名,就可以显示数组中所有数据的内容了。

   
四、输出格式

    一般来说, GDB 会根据变量的类型输出变量的值。但你也可以自定义 GDB 的输出的格式。例如,你想输出一个整数的十六进制,或是二进制来查看这个整型变量的中的位的情况。要做到这样,你可以使用 GDB 的数据显示格式:
   
    x 按十六进制格式显示变量。
    d 按十进制格式显示变量。
    u 按十六进制格式显示无符号整型。
    o 按八进制格式显示变量。
    t 按二进制格式显示变量。
    a 按十六进制格式显示变量。
    c 按字符格式显示变量。
    f 按浮点数格式显示变量。

        (gdb) p i
        $21 = 101   
       
        (gdb) p/a i
        $22 = 0x65
       
        (gdb) p/c i
        $23 = 101 'e'
       
        (gdb) p/f i
        $24 = 1.41531145e-43
       
        (gdb) p/x i
        $25 = 0x65
       
        (gdb) p/t i
        $26 = 1100101


五、查看内存

    你可以使用 examine 命令(简写是 x )来查看内存地址中的值。 x 命令的语法如下所示:
   
    x/<n/f/u> <addr>
   
    n 、 f 、 u 是可选的参数。
   
    n 是一个正整数,表示显示内存的长度,也就是说从当前地址向后显示几个地址的内容。
    f 表示显示的格式,参见上面。如果地址所指的是字符串,那么格式可以是 s ,如果地十是指令地址,那么格式可以是 i 。
    u 表示从当前地址往后请求的字节数,如果不指定的话, GDB 默认是 4 个 bytes 。 u 参数可以用下面的字符来代替, b 表示单字节, h 表示双字节, w 表示四字节, g 表示八字节。当我们指定了字节长度后, GDB 会从指内存定的内存地址开始,读写指定字节,并把其当作一个值取出来。
   
    <addr> 表示一个内存地址。

    n/f/u 三个参数可以一起使用。例如:
   
    命令: x/3uh 0x54320 表示,从内存地址 0x54320 读取内容, h 表示以双字节为一个单位, 3 表示三个单位, u 表示按十六进制显示。
   
   
六、自动显示

    你可以设置一些自动显示的变量,当程序停住时,或是在你单步跟踪时,这些变量会自动显示。相关的 GDB 命令是 display 。
   
    display <expr>
    display/<fmt> <expr>
    display/<fmt> <addr>
   
    expr 是一个表达式, fmt 表示显示的格式, addr 表示内存地址,当你用 display 设定好了一个或多个表达式后,只要你的程序被停下来, GDB 会自动显示你所设置的这些表达式的值。
   
    格式 i 和 s 同样被 display 支持,一个非常有用的命令是:
   
        display/i $pc
   
    $pc 是 GDB 的环境变量,表示着指令的地址, /i 则表示输出格式为机器指令码,也就是汇编。于是当程序停下后,就会出现源代码和机器指令码相对应的情形,这是一个很有意思的功能。
   
    下面是一些和 display 相关的 GDB 命令:
   
    undisplay <dnums...>
    delete display <dnums...>
    删除自动显示, dnums 意为所设置好了的自动显式的编号。如果要同时删除几个,编号可以用空格分隔,如果要删除一个范围内的编号,可以用减号表示(如: 2-5 )
   
    disable display <dnums...>
    enable display <dnums...>
    disable 和 enalbe 不删除自动显示的设置,而只是让其失效和恢复。
   
    info display
    查看 display 设置的自动显示的信息。 GDB 会打出一张表格,向你报告当然调试中设置了多少个自动显示设置,其中包括,设置的编号,表达式,是否 enable 。

七、设置显示选项

    GDB 中关于显示的选项比较多,这里我只例举大多数常用的选项。

    set print address
    set print address on
        打开地址输出,当程序显示函数信息时, GDB 会显出函数的参数地址。系统默认为打开的,如:
       
        (gdb) f
        #0 set_quotes (lq=0x34c78 "<<", rq=0x34c88 ">>")
            at input.c:530
        530         if (lquote != def_lquote)


    set print address off
        关闭函数的参数地址显示,如:
       
        (gdb) set print addr off
        (gdb) f
        #0 set_quotes (lq="<<", rq=">>") at input.c:530
        530         if (lquote != def_lquote)

    show print address
        查看当前地址显示选项是否打开。
       
    set print array
    set print array on
        打开数组显示,打开后当数组显示时,每个元素占一行,如果不打开的话,每个元素则以逗号分隔。这个选项默认是关闭的。与之相关的两个命令如下,我就不再多说了。
       
    set print array off
    show print array

    set print elements <number-of-elements>
        这个选项主要是设置数组的,如果你的数组太大了,那么就可以指定一个 <number-of-elements> 来指定数据显示的最大长度,当到达这个长度时, GDB 就不再往下显示了。如果设置为 0 ,则表示不限制。
       
    show print elements
        查看 print elements 的选项信息。
       
    set print null-stop <on/off>
        如果打开了这个选项,那么当显示字符串时,遇到结束符则停止显示。这个选项默认为 off 。
       
    set print pretty on
        如果打开 printf pretty 这个选项,那么当 GDB 显示结构体时会比较漂亮。如:

            $1 = {
              next = 0x0,
              flags = {
                sweet = 1,
                sour = 1
              },
              meat = 0x54 "Pork"
            }

    set print pretty off
        关闭 printf pretty 这个选项, GDB 显示结构体时会如下显示:
       
            $1 = {next = 0x0, flags = {sweet = 1, sour = 1}, meat = 0x54 "Pork"}
           
    show print pretty
        查看 GDB 是如何显示结构体的。
       
   
    set print sevenbit-strings <on/off>
        设置字符显示,是否按 “ /nnn ” 的格式显示,如果打开,则字符串或字符数据按 /nnn 显示,如 “ /065 ” 。
   
    show print sevenbit-strings
        查看字符显示开关是否打开。
       
    set print union <on/off>
        设置显示结构体时,是否显式其内的联合体数据。例如有以下数据结构:
       
        typedef enum {Tree, Bug} Species;
        typedef enum {Big_tree, Acorn, Seedling} Tree_forms;
        typedef enum {Caterpillar, Cocoon, Butterfly}
                      Bug_forms;
       
        struct thing {
          Species it;
          union {
            Tree_forms tree;
            Bug_forms bug;
          } form;
        };
       
        struct thing foo = {Tree, {Acorn}};

        当打开这个开关时,执行 p foo 命令后,会如下显示:
            $1 = {it = Tree, form = {tree = Acorn, bug = Cocoon}}
       
        当关闭这个开关时,执行 p foo 命令后,会如下显示:
            $1 = {it = Tree, form = {...}}

    show print union
        查看联合体数据的显示方式
       
    set print object <on/off>
        在 C++ 中,如果一个对象指针指向其派生类,如果打开这个选项, GDB 会自动按照虚方法调用的规则显示输出,如果关闭这个选项的话, GDB 就不管虚函数表了。这个选项默认是 off 。
   
    show print object
        查看对象选项的设置。
       
    set print static-members <on/off>
        这个选项表示,当显示一个 C++ 对象中的内容是,是否显示其中的静态数据成员。默认是 on 。
   
    show print static-members
        查看静态数据成员选项设置。
       
    set print vtbl <on/off>
        当此选项打开时, GDB 将用比较规整的格式来显示虚函数表时。其默认是关闭的。
       
    show print vtbl
        查看虚函数显示格式的选项。
       
       
八、历史记录

    当你用 GDB 的 print 查看程序运行时的数据时,你每一个 print 都会被 GDB 记录下来。 GDB 会以 $1, $2, $3 ..... 这样的方式为你每一个 print 命令编上号。于是,你可以使用这个编号访问以前的表达式,如 $1 。这个功能所带来的好处是,如果你先前输入了一个比较长的表达式,如果你还想查看这个表达式的值,你可以使用历史记录来访问,省去了重复输入。
   
   
九、 GDB 环境变量

    你可以在 GDB 的调试环境中定义自己的变量,用来保存一些调试程序中的运行数据。要定义一个 GDB 的变量很简单只需。使用 GDB 的 set 命令。 GDB 的环境变量和 UNIX 一样,也是以 $ 起头。如:
   
    set $foo = *object_ptr
   
    使用环境变量时, GDB 会在你第一次使用时创建这个变量,而在以后的使用中,则直接对其賦值。环境变量没有类型,你可以给环境变量定义任一的类型。包括结构体和数组。
   
    show convenience
        该命令查看当前所设置的所有的环境变量。
       
    这是一个比较强大的功能,环境变量和程序变量的交互使用,将使得程序调试更为灵活便捷。例如:
   
        set $i = 0
        print bar[$i++]->contents
   
    于是,当你就不必, print bar[0]->contents, print bar[1]->contents 地输入命令了。输入这样的命令后,只用敲回车,重复执行上一条语句,环境变量会自动累加,从而完成逐个输出的功能。
   
   
十、查看寄存器

    要查看寄存器的值,很简单,可以使用如下命令:
   
    info registers
        查看寄存器的情况。(除了浮点寄存器)
   
    info all-registers
        查看所有寄存器的情况。(包括浮点寄存器)
   
    info registers <regname ...>
        查看所指定的寄存器的情况。
       
    寄存器中放置了程序运行时的数据,比如程序当前运行的指令地址( ip ),程序的当前堆栈地址( sp )等等。你同样可以使用 print 命令来访问寄存器的情况,只需要在寄存器名字前加一个 $ 符号就可以了。如: p $eip 。

改变程序的执行
———————

    一旦使用 GDB 挂上被调试程序,当程序运行起来后,你可以根据自己的调试思路来动态地在 GDB 中更改当前被调试程序的运行线路或是其变量的值,这个强大的功能能够让你更好的调试你的程序,比如,你可以在程序的一次运行中走遍程序的所有分支。
   
   
一、修改变量值

    修改被调试程序运行时的变量值,在 GDB 中很容易实现,使用 GDB 的 print 命令即可完成。如:
   
        (gdb) print x=4
   
    x=4 这个表达式是 C/C++ 的语法,意为把变量 x 的值修改为 4 ,如果你当前调试的语言是 Pascal ,那么你可以使用 Pascal 的语法: x:=4 。
   
    在某些时候,很有可能你的变量和 GDB 中的参数冲突,如:
   
        (gdb) whatis width
        type = double
        (gdb) p width
        $4 = 13
        (gdb) set width=47
        Invalid syntax in expression.

    因为, set width 是 GDB 的命令,所以,出现了 “ Invalid syntax in expression ” 的设置错误,此时,你可以使用 set var 命令来告诉 GDB , width 不是你 GDB 的参数,而是程序的变量名,如:
   
        (gdb) set var width=47
       
    另外,还可能有些情况, GDB 并不报告这种错误,所以保险起见,在你改变程序变量取值时,最好都使用 set var 格式的 GDB 命令。
   

二、跳转执行

    一般来说,被调试程序会按照程序代码的运行顺序依次执行。 GDB 提供了乱序执行的功能,也就是说, GDB 可以修改程序的执行顺序,可以让程序执行随意跳跃。这个功能可以由 GDB 的 jump 命令来完:
   
    jump <linespec>
    指定下一条语句的运行点。 <linespce> 可以是文件的行号,可以是 file:line 格式,可以是 +num 这种偏移量格式。表式着下一条运行语句从哪里开始。
   
    jump <address>
    这里的 <address> 是代码行的内存地址。
   
    注意, jump 命令不会改变当前的程序栈中的内容,所以,当你从一个函数跳到另一个函数时,当函数运行完返回时进行弹栈操作时必然会发生错误,可能结果还是非常奇怪的,甚至于产生程序 Core Dump 。所以最好是同一个函数中进行跳转。
   
    熟悉汇编的人都知道,程序运行时,有一个寄存器用于保存当前代码所在的内存地址。所以, jump 命令也就是改变了这个寄存器中的值。于是,你可以使用 “ set $pc ” 来更改跳转执行的地址。如:
   
    set $pc = 0x485


三、产生信号量

    使用 singal 命令,可以产生一个信号量给被调试的程序。如:中断信号 Ctrl+C 。这非常方便于程序的调试,可以在程序运行的任意位置设置断点,并在该断点用 GDB 产生一个信号量,这种精确地在某处产生信号非常有利程序的调试。
   
    语法是: signal <singal> , UNIX 的系统信号量通常从 1 到 15 。所以 <singal> 取值也在这个范围。
   
    single 命令和 shell 的 kill 命令不同,系统的 kill 命令发信号给被调试程序时,是由 GDB 截获的,而 single 命令所发出一信号则是直接发给被调试程序的。
   

四、强制函数返回

    如果你的调试断点在某个函数中,并还有语句没有执行完。你可以使用 return 命令强制函数忽略还没有执行的语句并返回。
   
    return
    return <expression>
    使用 return 命令取消当前函数的执行,并立即返回,如果指定了 <expression> ,那么该表达式的值会被认作函数的返回值。
   
   
五、强制调用函数

    call <expr>
    表达式中可以一是函数,以此达到强制调用函数的目的。并显示函数的返回值,如果函数返回值是 void ,那么就不显示。
   
    另一个相似的命令也可以完成这一功能 —— print , print 后面可以跟表达式,所以也可以用他来调用函数, print 和 call 的不同是,如果函数返回 void , call 则不显示, print 则显示函数返回值,并把该值存入历史数据中。





在不同语言中使用 GDB
——————————

GDB 支持下列语言: C, C++, Fortran, PASCAL, Java, Chill, assembly, 和 Modula-2 。一般说来, GDB 会根据你所调试的程序来确定当然的调试语言,比如:发现文件名后缀为 “ .c ” 的, GDB 会认为是 C 程序。文件名后缀为 “ .C, .cc, .cp, .cpp, .cxx, .c++ ” 的, GDB 会认为是 C++ 程序。而后缀是 “ .f, .F ” 的, GDB 会认为是 Fortran 程序,还有,后缀为如果是 “ .s, .S ” 的会认为是汇编语言。

也就是说, GDB 会根据你所调试的程序的语言,来设置自己的语言环境,并让 GDB 的命令跟着语言环境的改变而改变。比如一些 GDB 命令需要用到表达式或变量时,这些表达式或变量的语法,完全是根据当前的语言环境而改变的。例如 C/C++ 中对指针的语法是 *p ,而在 Modula-2 中则是 p^ 。并且,如果你当前的程序是由几种不同语言一同编译成的,那到在调试过程中, GDB 也能根据不同的语言自动地切换语言环境。这种跟着语言环境而改变的功能,真是体贴开发人员的一种设计。


下面是几个相关于 GDB 语言环境的命令:

    show language
        查看当前的语言环境。如果 GDB 不能识为你所调试的编程语言,那么, C 语言被认为是默认的环境。
       
    info frame
        查看当前函数的程序语言。
       
    info source
        查看当前文件的程序语言。
   
如果 GDB 没有检测出当前的程序语言,那么你也可以手动设置当前的程序语言。使用 set language 命令即可做到。

    当 set language 命令后什么也不跟的话,你可以查看 GDB 所支持的语言种类:
   
        (gdb) set language
        The currently understood settings are:
       
        local or auto    Automatic setting based on source file
        c                Use the C language
        c++              Use the C++ language
        asm              Use the Asm language
        chill            Use the Chill language
        fortran          Use the Fortran language
        java             Use the Java language
        modula-2         Use the Modula-2 language
        pascal           Use the Pascal language
        scheme           Use the Scheme language
       
    于是你可以在 set language 后跟上被列出来的程序语言名,来设置当前的语言环境。
   
   

后记
——

    GDB 是一个强大的命令行调试工具。大家知道命令行的强大就是在于,其可以形成执行序列,形成脚本。 UNIX 下的软件全是命令行的,这给程序开发提代供了极大的便利,命令行软件的优势在于,它们可以非常容易的集成在一起,使用几个简单的已有工具的命令,就可以做 出一个非常强大的功能。