今天又帮女朋友处理了一下,她的实验数据,因为python是一年前经常用,最近找工作,用的是c,c++,python的有些东西忘记了,然后就一直催我,说我弄的慢,弄的慢,你自己弄啊,烦不烦啊,逼逼叨叨的,最后还不是我给弄好的?呵呵
好的,数据是这样的,我截个图
我用红括号括起来的,就是我所要提取的数据
其中lossstotal.txt是我要提取的原始数据,考虑两种方法去提取,前期以为所要提取行的数据是有一定规律的,后来发现,并不是,所以,我考虑用正则来提取,经过思考以后,完成了数据的提取,如下午所示,数据变的非常好看
代码如下:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
|
#coding:utf-8
#__author__ ='dell'
import re
f1 = file ( 'losstotal.txt' , 'r' )
data1 = f1.readlines()
# print data1
f1.close()
results = []
f2 = open ( 'loss2.txt' , 'w' )
# # 按照特定行提取,发现后面的行并无规律
# i = 0
# for line in data1:
# i+=1
# # print line
# if((i-1)%3==0):
# f2.write(line)
# print line
# 利用正则表达式
for line in data1:
data2 = line.split()
# print data2
for i in data2:
n = re.findall(r "iteration" , i)
# m=re.findall(r"loss", i)
if n:
# print line
f2.writelines(line)
f2.close()
f3 = file ( 'loss2.txt' , 'r' )
data3 = f3.readlines()
# print data1
f3.close()
f4 = open ( 'loss3.txt' , 'w' )
for line in data3:
data4 = line.split()
# print data2
for i in data4:
n = re.findall(r "loss" , i)
# m=re.findall(r"loss", i)
if n:
print line
f4.writelines(line)
f4.close()
# 去掉逗号
f5 = open ( 'loss3.txt' , 'r' )
data5 = f5.read()
f5 = data5.replace( ',' , ' ' )
f6 = file ( 'lossfinal.txt' , 'w' )
f6.write(f5)
f6.close()
# # 去掉等号=
f7 = open ( 'lossfinal.txt' , 'r' )
data7 = f7.read()
f7 = data7.replace( '=' , ' ' )
f8 = file ( 'lossfinal.txt' , 'w' )
f8.write(f7)
f8.close()
# data3=lin.split()
# for j in data3:
# m=re.findall(r"loss",i)
# if m:
# print lin
# # m=re.findall(r"sgd_solver.cpp",i)
# n=re.findall(r"iteration",i)
|
我在同样的目录下,还建立了
这几个txt文件,要不然,代码跑不通的哟。
解释:我连续用了两个正则,各自把含有特定字符串的行进行提取,两个写一起,发现还是不太会,所以分开写了,但是结果还是完成的不错!
以上这篇python提取具有某种特定字符串的行数据方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持服务器之家。
原文链接:https://blog.csdn.net/u011436427/article/details/82628597