python作为脚本性语言,加上它的简便易用性。会经常当作脚本用来处理一下数据和格式。其中处理文件就是频繁用处之一。简单编写几个常用的xls和txt读写函数,以后可以快速复用。
用到xlrd库函数需要预先install
命令:pip install xlrd
直接贴源码:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
|
#! /usr/bin/python
# coding:utf-8
import json
import xlrd
import sys
reload (sys)
sys.setdefaultencoding( 'utf-8' )
class ObjectFileReadAndWrite( object ):
@classmethod
def readXlsToDict( cls , xlsFile):
'''
读取xls文件生成dict
'''
data = xlrd.open_workbook(xlsFile)
table = data.sheet_by_index( 0 )
ret = []
keys = table.row_values( 0 )
for rowNum in range (table.nrows):
oneRowValues = table.row_values(rowNum)
if rowNum > 0 :
d = {}
for colIdx, key in enumerate (keys):
d[key] = oneRowValues[colIdx]
ret.append(d)
return ret
@classmethod
def readXlsToList( cls , xlsFile):
'''
读取xls文件生成list
'''
data = xlrd.open_workbook(xlsFile)
table = data.sheet_by_index( 0 )
ret = []
for rowNum in range (table.nrows):
oneRowValues = table.row_values(rowNum)
ret.append(oneRowValues)
return ret
@classmethod
def readTxt( cls , txtFile, sep):
'''
读取txt文件
'''
# with + open 可保证with语句执行完毕后同时关闭打开的文件句柄。
ret = []
with open (txtFile, "r" ) as f:
for line in f.readlines():
line = line.strip( '\n' ) # 去掉换行符
listInfo = line.split(sep) # 以 sep 分割成数组
if listInfo:
ret.append(listInfo)
return ret
@classmethod
def writeToJson( cls , jsonFile, ret):
'''
写入json文件
'''
with open (jsonFile, 'w' ) as fp:
json.dump(ret, fp, indent = 2 , sort_keys = True , encoding = "utf-8" , ensure_ascii = False )
@classmethod
def writeFromStr( cls , filePath, s):
'''
string写入文件
'''
with open (filePath, 'w' ) as fp:
fp.write(s)
@classmethod
def writeFromList( cls , filePath, wList):
'''
list写入文件
'''
with open (filePath, 'w' ) as fp:
fp.writelines(wList)
if __name__ = = "__main__" :
obj = ObjectFileReadAndWrite()
# xls
ret = obj.readXlsToDict(xlsFile = 'xxx.xls' )
obj.writeToJson( 'xxx.json' , ret)
# txt
ret2 = obj.readTxt(txtFile = 'result.txt' , sep = " " )
obj.writeToJson( 'result.json' , ret2)
|
因文件中有中文,中间遇到中文乱码问题
1
2
3
4
5
6
|
import sys
reload (sys)
sys.setdefaultencoding( 'utf-8' )
# encoding="utf-8", ensure_ascii=False
|
1、这个是由于Unicode编码与ASCII编码的不兼容造成的。
2、通常都是ascii,由此Python自然调用ascii编码解码程序去处理字符流,当字符流不属于ascii范围内,就会抛出异常(ordinal not in range(128))
百度了下通过 以上方式 解决了。
以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持服务器之家。
原文链接:https://blog.csdn.net/heshushun/article/details/114001317