初学时大多使用print或log调试程序,这在小规模的程序下很方便
但是更好的方法是一边运行一边检查里面的变量和方法
1.Pdb
Pdb是一个交互式的调试工具,集成于Python标准库中
Pdb能让你根据需求跳转到任意的Python代码断点、查看任意变量、单步执行代码,甚至还能修改变量的值,而不必重启程序
⚠️pdb 调试有个明显的缺陷就是对于多线程,远程调试等支持得不够好,同时没有较为直观的界面显示,不太适合大型的 python 项目。
而在较大的 python 项目中,这些调试需求比较常见,因此需要使用更为高级的调试工具,如PyCharm IDE。
手册:https://docs.python.org/3.5/library/pdb.html#pdbcommand-where
pdb的使用方式和ipdb是一样的
2.ipdb
ipdb是增强版的pdb,参考https://github.com/gotcha/ipdb
1)安装:
(deeplearning) userdeMacBook-Pro:dogcat- user$ pip install ipdb
Requirement already satisfied: ipdb in /anaconda3/envs/deeplearning/lib/python3./site-packages (0.12)
...
ipdb提供了调试模式下的代码自动补全,还具有更好的语法高亮和代码溯源,以及更好的内省功能。它与pdb接口完全兼容
2)结合PyTorch和ipdb进行调试
1》集成到源代码中
要使用ipdb,只需要在想要进行调试的地方插入语句:
import ipdb
ipdb.set_trace() #相当于添加断点
当代码运行到这里,就会自动进入交互式调试模式
上面的方式虽然简单,但是存在着两个较为比较明显的问题:
- 插入的断点代码会污染原来的代码空间
- 每次插入断点都需要修改源码
try:
import ipdb
except:
import pdb as ipdb def sum(x):
r =
for ii in x:
r += ii
return r def mul(x):
r =
for ii in x:
r *= ii
return r ipdb.set_trace()
x = [,,,,]
r = sum(x)
r = mul(x)
当程序运行到ipdb.set_trace()语句时,会自动进入debug模式,在该模式中,我们可使用调试命令,如next或缩写n实现单步执行;也可以查看Python变量,或是运行Python代码
如果Python变量名和调试命令冲突,需在变量名前加!,这样ipdb会执行对应的Python命令,而不是调试命令
下面举例说明ipdb的调试
这里重点讲解ipdb的两大功能:
- 查看:在函数调用堆栈中*跳动,并查看函数的局部变量
- 修改:修改程序中的变量,并能以此影响程序的运行结果
将上面的命令生成ipdb_test.py文件,使用命令行进行调试
(deeplearning) userdeMacBook-Pro:pytorch-learning user$ python ipdb_test.py
> /Users/user/pytorch/jupyter/pytorch-learning/ipdb_test.py()<module>()
ipdb.set_trace()
---> x = [,,,,]
r = sum(x)
--->光标所指处为运行到的代码
下面进行说明调试时能够使用的命令:
l 1,18 : list 1,18的缩写,查看第1行到18行的代码
ipdb> l ,
try:
import ipdb
except:
import pdb as ipdb def sum(x):
r =
for ii in x:
r += ii
return r def mul(x):
r =
for ii in x:
r *= ii
return r ipdb.set_trace()
n : next的缩写,执行下一步;如果当前语句有一个函数调用,用 n 是不会进入被调用的函数体中的
ipdb> n
> /Users/user/pytorch/jupyter/pytorch-learning/ipdb_test.py()<module>()
x = [,,,,]
---> r = sum(x)
r = mul(x)
s : step的缩写,进入函数sum内部
ipdb> s
--Call--
> /Users/user/pytorch/jupyter/pytorch-learning/ipdb_test.py()sum() ----> def sum(x):
r =
再继续单步执行,再在函数中继续执行,耶可以不用输入n,直接回车则会使用上次的命令
ipdb> n
> /Users/user/pytorch/jupyter/pytorch-learning/ipdb_test.py()sum()
def sum(x):
----> r =
for ii in x: ipdb> n
> /Users/user/pytorch/jupyter/pytorch-learning/ipdb_test.py()sum()
r =
----> for ii in x:
r += ii ipdb> n
> /Users/user/pytorch/jupyter/pytorch-learning/ipdb_test.py()sum()
for ii in x:
----> r += ii
return r
u : up的缩写,跳回上一层的调用
ipdb> u
> /Users/user/pytorch/jupyter/pytorch-learning/ipdb_test.py()<module>()
x = [,,,,]
---> r = sum(x)
r = mul(x)
d : down的缩写,跳回之前调用到的下一层的位置
ipdb> d
> /Users/user/pytorch/jupyter/pytorch-learning/ipdb_test.py()sum()
for ii in x:
----> r += ii
return r
当查看变量的命令和调试命令起冲突时,在前面加一个!
查看r变量,该变量名与调试命令r(eturn) 起冲突
ipdb> !r
return : 继续运行,直到函数返回,结束该sum()函数的运算
ipdb> return
--Return-- > /Users/user/pytorch/jupyter/pytorch-learning/ipdb_test.py()sum()
r += ii
---> return r
当命令和调试命令没有冲突的时候,可以直接运行,不用添加!
这里查看变量x的值,并对变量值进行修改
ipdb> n
> /Users/user/pytorch/jupyter/pytorch-learning/ipdb_test.py()<module>()
x = [,,,,]
r = sum(x)
---> r = mul(x) ipdb> x
[, , , , ]
ipdb> x[0] = 10000
b 13 : break的缩写,在13行处添加一个断点,如果没有添加位置则输出所有的断点信息
ipdb> b
Breakpoint at /Users/user/pytorch/jupyter/pytorch-learning/ipdb_test.py:
c : continue的缩写,继续运行,直到遇到断点
ipdb> c
> /Users/user/pytorch/jupyter/pytorch-learning/ipdb_test.py()mul()
def mul(x):
--> r =
for ii in x: ipdb> return
--Return-- > /Users/user/pytorch/jupyter/pytorch-learning/ipdb_test.py()mul()
r *= ii
---> return r
return后得到的是修改后的x的乘积
l(ist) 或 ll : ll
是查看整个源码文件,l
可指定需要查看的行数,默认是当前往后 11 行,也可指定具体的范围
ipdb> list def mul(x):
r =
for ii in x:
r *= ii
---> return r ipdb.set_trace()
x = [,,,,]
r = sum(x)
r = mul(x)
pp 或 p expression: 打印变量的值,两者的不同是p用的是print(),pp用的是pprint()
ipdb> pp x
[, , , , ]
ipdb> x
[, , , , ]
exit 或 q(uit) : 中止并退出
ipdb> q
Exiting Debugger.
关于ipdb的使用还又一些技巧:
- <tab>键能够自动补齐,补齐用法与IPython中的类似
- 可以直接在ipdb中修改变量的值
- h(elp)能够查看调试命令的用法,比如h h可以查看h(elp)命令的用法,h jump能够查看j(ump)命令的用法
其他命令:
run 或 restart
[args ...]
:两者就是别名的关系,重新运行该python调试项目,如果提供了参数,会使用shlex进行分离,并将结果作为新的sys.argv。历史记录、断点、行动和调试选项都会保留。
run [args ...]:这里的参数会作为运行脚本的参数
(deeplearning) userdeMBP:pytorch-learning user$ python -m ipdb ipdb_test.py
/anaconda3/envs/deeplearning/lib/python3./runpy.py:: RuntimeWarning: 'ipdb.__main__' found in sys.modules after import of package 'ipdb', but prior to execution of 'ipdb.__main__'; this may result in unpredictable behaviour
warn(RuntimeWarning(msg))
> /Users/user/pytorch/jupyter/pytorch-learning/ipdb_test.py()<module>()
----> def sum(x):
r =
for ii in x: ipdb> run --x [,,,]
Restarting ipdb_test.py with arguments:
--x [,,,]
> /Users/user/pytorch/jupyter/pytorch-learning/ipdb_test.py()<module>()
----> def sum(x):
r =
for ii in x: ipdb> import sys
ipdb> sys.argv
['ipdb_test.py', '--x', '[3,3,3,3]']
看到上面的结果,等价于 python ipdb_test.py --x [3,3,3,3],这个参数会作为运行sum(x)的参数
如果要得到的是全新的调试器,使用exit 或 q(uit)
通过b设置的断点在重新运行 debug 程序 (命令 restart
或 run
) 后会依然保留,如果要忽略这些断点,有两种做法:
- cl(ear) :如果后面带有参数,就是清除指定的断点;如果不带参数就是清除所有的断点
(deeplearning) userdeMacBook-Pro:pytorch-learning user$ python ipdb_test.py
> /Users/user/pytorch/jupyter/pytorch-learning/ipdb_test.py()<module>()
ipdb.set_trace()
---> x = [,,,,]
r = sum(x) ipdb> b
Breakpoint at /Users/user/pytorch/jupyter/pytorch-learning/ipdb_test.py:
ipdb> cl
Deleted breakpoint at /Users/user/pytorch/jupyter/pytorch-learning/ipdb_test.py:
ipdb> c
(deeplearning) userdeMacBook-Pro:pytorch-learning user$
因为设置的断点被清除了,所以运行c会直接结束
- disable/enable :禁用/激活断点
(deeplearning) userdeMacBook-Pro:pytorch-learning user$ python ipdb_test.py
> /Users/user/pytorch/jupyter/pytorch-learning/ipdb_test.py()<module>()
ipdb.set_trace()
---> x = [,,,,]
r = sum(x) ipdb> b
Breakpoint at /Users/user/pytorch/jupyter/pytorch-learning/ipdb_test.py:
ipdb> b
Breakpoint at /Users/user/pytorch/jupyter/pytorch-learning/ipdb_test.py:
ipdb> disable
Disabled breakpoint at /Users/user/pytorch/jupyter/pytorch-learning/ipdb_test.py:
ipdb> c
> /Users/user/pytorch/jupyter/pytorch-learning/ipdb_test.py()sum()
for ii in x:
---> r += ii
return r ipdb>
因为禁用了8处的断点,所以运行c直接就到了9的断点处
j(ump) :让程序跳转到指定的行数 ,能够跳过中间某些行代码的执行
注意:但是必须跳转的地方在当前的代码块中
ipdb> j
*** Jump failed: line comes after the current code block
ipdb> j
> /Users/user/pytorch/jupyter/pytorch-learning/ipdb_test.py()sum()
r += ii
---> return r ipdb>
w(here) : 显示最近的一些栈帧信息
ipdb> w
/Users/user/pytorch/jupyter/pytorch-learning/ipdb_test.py()<module>()
x = [,,,,]
---> r = sum(x)
r = mul(x) > /Users/user/pytorch/jupyter/pytorch-learning/ipdb_test.py()sum()
r += ii
---> return r
a(rgs) : 返回目前函数的参数列表
ipdb> a
x = [, , , , ]
这个sum()函数现在的参数就只有一个x
2》通过命令行进行交互
这种方法与上面方法不同在于不需要在代码中插入断点语句,而是在运行时添加-m参数运行,然后再进行调试
生成ipdb_test_command.py:
#import ipdb
def sum(x):
r =
for ii in x:
r += ii
return r def mul(x):
r =
for ii in x:
r *= ii
return r #ipdb.set_trace()
x = [,,,,]
r = sum(x)
r = mul(x)
运行:
(deeplearning) userdeMacBook-Pro:pytorch-learning user$ python -m ipdb ipdb_test_command.py
/anaconda3/envs/deeplearning/lib/python3./runpy.py:: RuntimeWarning: 'ipdb.__main__' found in sys.modules after import of package 'ipdb', but prior to execution of 'ipdb.__main__'; this may result in unpredictable behaviour
warn(RuntimeWarning(msg))
> /Users/user/pytorch/jupyter/pytorch-learning/ipdb_test.py()<module>()
#import ipdb
----> def sum(x):
r = ipdb> n
> /Users/user/pytorch/jupyter/pytorch-learning/ipdb_test.py()<module>() ----> def mul(x):
r = ipdb> n
> /Users/user/pytorch/jupyter/pytorch-learning/ipdb_test.py()<module>()
#ipdb.set_trace()
---> x = [,,,,]
r = sum(x) ipdb> n
> /Users/user/pytorch/jupyter/pytorch-learning/ipdb_test.py()<module>()
x = [,,,,]
---> r = sum(x)
r = mul(x) ipdb> s
--Call--
> /Users/user/pytorch/jupyter/pytorch-learning/ipdb_test.py()sum()
#import ipdb
----> def sum(x):
r = ipdb>
-m参数,这样调用ipdb_test_command.py的话断点就是程序的执行第一行之前
然后就可以和上面一样使用命令进行调试
3.支持的函数
参考https://docs.python.org/3.5/library/pdb.html#pdbcommand-where
该模块定义了以下功能;每个进入调试器的方式略有不同:
pdb.set_trace()
从正在运行的程序中插入调试器的典型用法是插入
import pdb; pdb.set_trace()
在要进入调试器的位置插入上面的函数。然后,你可以按照此语句逐步执行代码,并使用continue命令在没有调试器的情况下继续运行。
大多数情况都只使用set_trace()函数和上面命令进行配合调试,下面的函数使用得比较少,没能查找到过多下面函数使用的情况,如果有小伙伴有这方面的资料,希望可以告知,谢谢
-
pdb.
run
(statement, globals=None, locals=None) -
在调试器控制下执行语句(以字符串或代码对象的形式给出)。调试器提示符出现在执行任何代码之前;您可以设置断点并键入continue来运行到断点,或者使用step或next逐步执行语句。可选的全局变量和局部变量指定执行代码的环境;默认情况下使用模块__main__的字典。(参见内置的exec()或eval()函数的说明。)
-
pdb.
runeval
(expression, globals=None, locals=None) -
计算调试器控制器下的表达式(以字符串或代码对象的形式给出)。当runeval()返回时,它返回表达式的值。否则,这个函数类似于run()。
-
pdb.
runcall
(function, *args, **kwds) -
使用给定的参数调用函数(函数或方法对象,而不是字符串)。当runcall()返回时,它返回函数调用返回的任何值。一旦输入函数,调试器提示符就会出现。
-
pdb.
set_trace
() -
在调用堆栈帧中输入调试器。这对于在程序中在给定点硬编码断点非常有用,即使代码没有被调试(例如,当断言失败时)。
-
pdb.
post_mortem
(traceback=None) -
输入给定traceback对象的事后调试。如果没有给出traceback,则使用当前正在处理的异常之一(如果要使用缺省值,则必须处理异常)。
-
pdb.
pm
() -
输入在sys.last_traceback中找到的traceback的事后调试。
run*函数和set_trace()是实例化Pdb类和调用同名方法的别名。如果你想获得更多的功能,你必须自己做:
-
class
pdb.
Pdb
(completekey='tab', stdin=None, stdout=None, skip=None, nosigint=False) -
Pdb是调试器类。
completekey、stdin和stdout参数被传递给底层
cmd.Cmd
类;如果给定了skip参数,则它必须是可迭代的全局样式模块名称模式。调试器不会进入起源于与这些模式之一匹配的模块中的框架。
默认情况下,当您发出continue命令时,Pdb为SIGINT信号设置一个处理程序(当用户在控制台上按Ctrl-C时发送该信号)。这允许您通过按Ctrl-C再次进入调试器。如果希望Pdb不接触SIGINT处理程序,请将nosigint设置为true。
启用跟踪与skip的例子调用:
import pdb; pdb.Pdb(skip=['django.*']).set_trace()
新版本3.1:skip参数。
新版本3.2:nosigint参数。以前,Pdb从未设置过SIGINT处理程序。