本文实例讲述了Python基于正则表达式实现检查文件内容的方法分享给大家供大家参考,具体如下:
这个是之前就在学python,欣赏python的小巧但是功能强大,是连电池都自带的语言。平时工作中用Java ,觉得python在日常生活中比java用处要大,首先语法没那么复杂,特别是io的操作,java里要写一大坨没关的代码。还有就是不用编译,而且linux系统默认都会自带。
这次遇到的问题是工作当中想要迁移一个系统中的一个模块,这个时候需要评估模块里的代码有没有对其他代码强依赖,就是有没有import 其他模块的代码。如果通过人肉来坐,少量的文件还好,如果有大量的文件实在是很悲剧。这个时候就想起可以用pytho来检索文件,通过正则表达式分析文件内容,把有问题的文件名打印出来就可以了。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
|
import os
import os.path
import re
packDir = '/**/src/main/java/com/hz/yk/auction'
p1 = re. compile (r "yk\.((?!auction)\w)+\b" )
p2 = re. compile (r "yk\.((?!domain)\w)+\b" )
p3 = re. compile (r "yk\.((?!utils)\w)+\b" )
def processDirectory(args,dirname,filenames):
# print 'Directory',dirname
for filename in filenames:
if os.path.splitext(filename)[ 1 ] = = '.java' :
# print 'file',filename
fileObj = open (dirname + "/" + filename)
hasOther = False
for line in fileObj:
if p1.search(line) and p2.search(line) and p3.search(line):
hasOther = True
print line
if hasOther:
print 'file:' ,filename
def search():
os.path.walk(packDir,processDirectory, None )
if __name__ = = '__main__' :
search()
|
因为希望看到应用其他模块的代码,所以排除掉自己的模块名auction和公共的应用domain,utils 。对剩下的符合条件的打印出import这句和文件名sikuli
希望本文所述对大家Python程序设计有所帮助。
原文链接:http://blog.csdn.net/ykdsg/article/details/11392371