本文介绍用python实现的搜索本地文本文件内容的小程序。从而学习python i/o方面的知识。代码如下:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
|
import os
#根据文件扩展名判断文件类型
def endwith(s, * endstring):
array = map (s.endswith,endstring)
if true in array:
return true
else :
return false
#将全部已搜索到的关键字列表中的内容保存到result.log文件中
def writeresultlog(allexistskeywords):
#行分隔符
ls = os.linesep
#结果日志文件名
logfilename = "result.log" #相对路径,文件在.py文件所在的目录中
try :
fobj = open (logfilename, 'w' )
except ioerror,e:
print "*** file open error:" ,e
else :
fobj.writelines([ '%s%s' % (keyword,ls) for keyword in allexistskeywords])
fobj.close()
#搜索指定关键字是否在指定的文件中存在
def searchfilescontent(dirname):
#从searchkeywords.txt文件中初始化待搜索关键字列表
filename = "searchkeywords.txt" #相对路径,文件在.py文件所在的目录中
#待搜索关键字列表
allsearchkeywords = []
#遍历文件当前行已搜索到的关键字列表
existskeywordsthisline = []
#全部已搜索到的关键字列表
allexistskeywords = []
try :
fobj = open (filename, 'r' );
except ioerror,e:
print "*** file open error:" ,e
else :
for eachline in fobj:
allsearchkeywords.append(eachline.strip( '\n' )); #使用strip函数去除每行的换行符
fobj.close();
#从excludekeywords.txt文件中初始化要排除的搜索关键字列表
filename = "excludekeywords.txt" #相对路径,文件在.py文件所在的目录中
#要排除的搜索关键字列表
allexcludedkeywords = []
try :
fobj = open (filename, 'r' );
except ioerror,e:
print "*** file open error:" ,e
else :
for eachline in fobj:
allexcludedkeywords.append(eachline.strip( '\n' )); #使用strip函数去除每行的换行符
fobj.close();
#从全部已搜索到的关键字列表排除掉不用搜索的关键字
for excluedkw in allexcludedkeywords:
if (excluedkw in allsearchkeywords):
allsearchkeywords.remove(excluedkw);
#遍历打开所有要在其中搜索内容的文件,若待搜索关键字列表为空,则不再继续遍历
for root,dirs,files in os.walk(dirname):
for file in files:
if endwith( file , '.java' , '.xml' , '.properties' ): #只在扩展名为.java/.xml/.properties文件中搜索
#打开文件
filename = root + os.sep + file #绝对路径
filename = filename.replace( "\\"," \\\\ ") #将路径中的单反斜杠替换为双反斜杠,因为单反斜杠可能会导致将路径中的内容进行转义了,replace函数中" \\ "表示单反斜杠," \\\\"表示双反斜杠
try :
fobj = open (filename, 'r' );
except ioerror,e:
print "*** file open error:" ,e
else :
#遍历文件的每一行
for fileline in fobj:
#判断当前行是否包含所有搜索关键字
for keyword in allsearchkeywords:
#若包含,并添加到该行已搜索到的关键字列表中
if keyword.upper() in fileline.upper(): #将搜索关键字和该行文本内容都转换为大写后再进行匹配
existskeywordsthisline.append(keyword)
#将这些搜索到的关键字添加到全部已搜索到的关键字列表中,并包含文件名信息
for keyword in existskeywordsthisline:
allexistskeywords.append(keyword + "\t" + filename.replace( "\\\\"," \\"))
#将这些搜索到的关键字从待搜索关键字列表中移除(后续将不再搜索该关键字)
for keyword in existskeywordsthisline:
allsearchkeywords.remove(keyword)
#清空该行已搜索到的关键字列表内容
existskeywordsthisline = []
#若所有的关键字都搜索到了,则记录日志文件,并结束搜索工作
if len (allsearchkeywords) = = 0 :
fobj.close();
writeresultlog(allexistskeywords)
print "done!" ,
return
fobj.close();
#全部文件遍历结束
writeresultlog(allexistskeywords)
print "done!" ,
#仅当本python模块直接执行时,才执行如下语句,若被别的python模块引入,则不执行
if __name__ = = '__main__' :
searchfilescontent(r "g:\ccssmartpipe\smartpipe\src\java" )
|
1.笔者使用该程序对java项目中的源文件内容进行关键字的搜索。程序入参为该项目本地文件系统路径g:\ccssmartpipe\smartpipe\src\java。
2.在配置文件中searchkeywords.txt中输入要搜索的任意多个关键字
3.在配置文件中excludekeywords.txt中输入在searchkeywords.
4.程序执行完成后,即可在result.log日志文件中,查看搜索结果。即每个关键在哪些文件中存在。并给出每个文件的具体路径。
附件:源代码及配置文件
以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持服务器之家。
原文链接:https://blog.csdn.net/warrenjiang/article/details/50277279