本文实例讲述了Python统计文件中去重后uuid个数的方法。分享给大家供大家参考。具体如下:
利用正则表达式按行获取日志文件中的的uuid,并且统计这些uuid的去重个数(去重利用set)
1
2
3
4
5
6
7
8
9
10
|
import re
pattern = re. compile (r '&uuid=.*&' )
uuidset = set ()
with open ( 'request.log.2015-05-26' , 'rt' ) as f:
for line in f:
all = pattern.findall(line)
if len ( all )> 0 and line.find( 'iphone' )> 0 :
# print(all[0])
uuidset.add( all [ 0 ])
print ( len (uuidset))
|
希望本文所述对大家的Python程序设计有所帮助。