第一节:python读取excel文件

时间:2023-03-09 18:34:30
第一节:python读取excel文件

  写在前面:

(1)Excel中数字格式int(1),读出的是float(1.0)类型,导致传参时造成不同,强制转换时,int(str(1.0))在2.7版本又会报错ValueError: invalid literal for int() with base 10: '1.0',经查阅资料后,发现数字类型在Excel中设置格式为

“文本”时会避免此问题发生;

(2)Excel中包含中文时,读出的是str类型,断言时,self.assertEqual(self.info['msg'], int(self.msg)),self.info['msg']为<type 'unicode'>,这就会导致断言失败。self.assertEqual(self.info['msg'], self.msg.decode("utf-8"))能够解决此问题;

本文中,读取Excel文件用的是xlrd库,检查库是否已安装(import xlrd),未报错则说明已安装成功,然后就可以开始练习啦!

在度娘里了解了xlrd库的用法后,先尝试着写了下面这些简单代码:

# -*- coding:utf-8 -*-
import xlrd
def read_excel(xls_name,sheet_name):
worksheet = xlrd.open_workbook(xls_name)
sheet = worksheet.sheet_by_name(sheet_name) for row in range(sheet.nrows):
for col in range(sheet.ncols):
#打印单元格内容
print sheet.cell(row,col) if __name__ == "__main__":
read_excel(r"F:\AONE\parameter.xlsx","第一周")

运行后,果然不负所望,运行报错,学习的路程是艰难的,顺风顺水是不存在的。错误如下:

xlrd.biffh.XLRDError: No sheet named <'\xe7\xac\xac\xe4\xb8\x80\xe5\x91\xa8'>

      查看报错位置,带有中文字符“第一周”,然后这个sheet没有找到!OK,根据以往经验,又是编码问题了,乖乖的设置默认编码后,运行后,成功!!,完整代码如下:

# -*- coding:utf-8 -*-
import xlrd import sys
reload(sys)
sys.setdefaultencoding("utf-8") def read_excel(xls_name,sheet_name):
worksheet = xlrd.open_workbook(xls_name)
sheet = worksheet.sheet_by_name(sheet_name) for row in range(sheet.nrows):
for col in range(sheet.ncols):
print sheet.cell(row,col) if __name__ == "__main__":
read_excel(r"F:\AONE\parameter.xlsx","第一周")

上面代码运行后,的确是没有报错,但是呢,结果Excel文件里中文不显示,时间显示怪异,直接上图:

第一节:python读取excel文件

得!继续排雷!先解决时间显示异常的问题吧!然后呢!又问度娘!前辈是伟大的,果然有前辈留的武功秘籍,判断表格中的ctype,将包含时间的表格内容转换为tuple。按照思路,对我的时间格式进行了下整理。幸运的是,在解决时间异常的问题时,也解决了中文显示异常的问题!果然上帝还是眷顾爱学习的人啊!

完整代码:

# -*- coding:utf-8 -*-
import xlrd
import sys
reload(sys)
sys.setdefaultencoding("utf-8") def read_excel(xls_name,sheet_name):
worksheet = xlrd.open_workbook(xls_name)
sheet = worksheet.sheet_by_name(sheet_name) for row in range(sheet.nrows):
for col in range(sheet.ncols):
#获取单元格内容
value = sheet.cell(row,col).value
#如果表格中ctype为3,则将其转换为tuple
if sheet.cell(row,col).ctype == 3:
date = xlrd.xldate_as_tuple(sheet.cell(row,col).value,0)
value = str(date[3])+":"+str(date[4])
print value if __name__ == "__main__":
read_excel(r"F:\AONE\parameter.xlsx","第一周")

运行结果如下图:

第一节:python读取excel文件

至此,使用xlrd读取Excel文件并输出已完成!