如何用python循环读取下面.txt文件中,用红括号标出来的数据呢?
首先,观察数据可知,不同行的第一个数据元素不一样,所以考虑直接用正则表达式。
再加上,对读和写文件的操作,就行了
注:我用的是pycharm+python2.7
话不多说,直接上代码
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
|
import re
f1 = file ( 'shen.txt' , 'r' )
data1 = f1.readlines()
# print data1
f1.close()
results = []
for line in data1:
data2 = line.split()
# print data2[0]
m = re.findall(r "[0-9]:" , data2[ 0 ])
if m:
results.append(line)
# for i in data2[0]:
# data3=i.split(":")
# print data3
# if data3>=0 and data3<=50000:
# results.append(line)
# if i=='1':
# results.append(line)
f2 = file ( 'deal.txt' , 'w' )
f2.writelines(results)
f2.close()
|
前期,我遇到“1:”这样的字符串实在是没办法处理,后来查找资料,发现有正则这么爽的东西!
在上面的代码中,需要说明的是:
1
|
m = re.findall(r "[0-9]:" , data2[ 0 ])
|
该语句的意思就是,对于字符串而言,寻找到能够匹配1:,2:,9:。。。。。。的字符串
最后处理的结果是:
由于数据不是很漂亮,还需要将里面的“,”和“:”这两个符号去掉,因此,我使用了replace语句
代码如下:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
|
#coding:utf-8
#__author__ ='dell'
import re
f1 = file ( 'shen.txt' , 'r' )
data1 = f1.readlines()
# print data1
f1.close()
results = []
for line in data1:
data2 = line.split()
# print data2[0]
m = re.findall(r "[0-9]:" , data2[ 0 ])
if m:
results.append(line)
# for i in data2[0]:
# data3=i.split(":")
# print data3
# if data3>=0 and data3<=50000:
# results.append(line)
# if i=='1':
# results.append(line)
f2 = file ( 'deal.txt' , 'w' )
f2.writelines(results)
f2.close()
# 替换掉所有的逗号,
f4 = open ( 'deal.txt' , 'r' )
data3 = f4.read()
f4 = data3.replace( ',' , ' ' )
f5 = file ( 'deal.txt' , 'w' )
f5.write(f4)
f5.close()
# 替换掉所有的冒号
f6 = open ( 'deal.txt' , 'r' )
data4 = f6.read()
f6 = data4.replace( ':' , ' ' )
f7 = file ( 'deal.txt' , 'w' )
f7.write(f6)
f7.close()
|
最终,得到的数据就很漂亮了,如下所示:
以上这篇使用python读取.text文件特定行的数据方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持服务器之家。
原文链接:https://blog.csdn.net/u011436427/article/details/81874646