[python]关于字符串查找和re正则表达式的效率对比

时间:2022-03-27 18:47:13

最近需要在python中做大日志文件中做正则匹配

开始直接在for in 中每行做re.findall,后来发现,性能不行,就在re前面做一个基本的字符串包含判断 (str in str),如果不包含直接continue

效率对比:

1、只做一次包含判断:

real 0m13.740s
user0m12.683s
sys0m1.046s

 

2、做两次包含判断:

real 0m9.226s
user0m8.134s
sys0m1.069s

 

3、不做包含判断:

real 0m25.205s
user0m24.165s
sys0m1.021s

 

样本日志1G