使用Python操作Excel文档(一)

时间:2023-03-08 18:13:53

Python | 使用Python操作Excel文档(一)

0 前言

在阅读本文之前,请确保您已满足或可能满足以下条件:

  1. 请确保您具备基本的Python编程能力。

  2. 请确保您会使用Excel。

  3. 请确保您的电脑已经安装好Python且pip可用。

另外操作Excel需要使用openpyxl模块,请安装好该模块:

pip install openpyxl

演示环境:

  1. 演示环境为win10+Python3.6

  2. openpyxl版本为2.6.2

  3. 调试工具为IDLE

1. openpyxl简述

openpyxl操作Excel的第三方库,作者是Eric Gazoni, Charlie Clark。您也可以访问openpyxl的官方网站通过官方手册进行学习。同时附上官方网站的地址:

https://openpyxl.readthedocs.io/en/stable/index.html。

目前openpyxl的最新版本是2.6.2版本。在openpyxl之前,我们使用xlrd和xlwt来操作Excel表格,事实上这两个库也非常好用,一读一写,然而遗憾的是它们只能操作2003及以前的版本,而openpyxl却能支持2010版本。

另外这里附上源码地址,感兴趣的同学可以自行下载学习或者参与开发:

http://bitbucket.org/openpyxl/openpyxl/src

2. 创建/读取一个Excel工作簿

我们知道一个xlsx文件叫做工作簿,工作簿中的每一张表叫做工作表,表中每个格叫做单元格。

创建工作簿,示例代码如下:

from openpyxl import Workbook
wb = Workbook().save("example.xlsx")

Workbook对象是一个用来创建一个工作簿,save方法用来将这个对象保存成一个文件。

可以查看一下,程序执行的目录下是不是出现了一个example.xlsx文件。这时,是一个全新的文件,里面只有一张默认的表。

读取已存在的xlsx文件,使用openpyxl中的load_wordbook()方法。示例代码如下:

from openpyxl import load_workbook
wb = load_workbook("example.xlsx")

4. 操作Excel表:读取,创建,删除,复制

每个工作表都是一个Worksheet对象。

首先访问wb的sheetnames属性来获取文件中的所有工作表的名字,:

wb.sheetnames # ['Sheet']

一般来说,当我们打开一个Excel表格,会看到上次我们保存的表。这个表是活动状态的。我们可以使用Workbook类中的active属性来读取这张表。

ws = wb.active 

ws就是我们要操作的表了。你可以使用ws的title属性来获取表明,一般当我们创建一个xlxs文件的时候,会默认创建一张表Sheet,接下来我们对ws的操作,就是对这张表的操作,可以理解成对ws的操作会反映到这张表上。

例如访问ws的title属性,可以获取或修改表名。ws是一个Worksheet对象,也可以使用Workbook类中的get_sheet_by_name("sheet_name")方法读取这张表。也可以使用wb[表名]的方式,但是旧版本的openpyxl可能会不知这种访问方式。使用title给这张表重命名:

ws.title # 'Sheet'
ws = wb.get_sheet_by_name("Sheet")
ws.title # 'Sheet'
ws.title = "demo"
wb.sheetnames # ['demo']
ws = wb["demo"]

创建一张表,使用Workbook中的create_sheet()方法:

 ws1 = wb.create_sheet("demo1")
 wb.sheetnames # ['demo', 'demo1']

删除一张表,使用Workbook中的remove_sheet()方法:

wb.remove_sheet(ws1) 
wb.sheetnames # ['demo']

需要注意的是,也可以使用wb.remove(ws1)del w["demo1"],但是不建议这种写法。

复制一张表,使用Workbook中的copy_worksheet()方法:

ws2 = wb.copy_worksheet(ws)
wb.sheetnames # ['demo', 'demo Copy']

PS:旧版的openpyxl可能不支持sheetnames属性,这时可以使用Workbook类中的get_sheet_names()方法,旧版中也可能不支持wb[表名]的访问方式以及active属性,这时可以使用get_active_sheet()方法

5. 操作单元格

每个单元格都是一个Cell对象。

访问单元格,需要使用坐标,坐标的表示方式有两种,一种是使用字符串,如‘A1’,表示的是第一列,第一行。。另一种就是使用标准得坐标如,column=1, row=1,利用ws中的cell方法来第一行第一列的单元格。访问单元格的方式是使用如ws['A1'], 即表变量[坐标]

ws['A1'] = 0
ws.cell(row=1, column=1, value=0)
print(ws['A1'].value) # 0

需要强调的是,虽然可以直接给单元格赋值,但是要读取这个值,还是需要访问Cell类中的value属性的。而且坐标必须从1开始。

PS:部分旧版可能不支持表变量[坐标]的访问方式,这时,可以使用ws.Cell('A1')或ws.Cell(column=1, row=1)的方式来访问。

6. 向表中写入大量数据

for i in range(1, 20):
    for j in range(1, 20):
        ws.cell(i,j,value=i*j)

需要注意的是,使用cell时,坐标至少是1,也就是说,大于0的整数。

wb.save("example.xlsx")

好,到这里,我们保存,来看下效果。

7.复习下今天内容

关于使用openpyxl操作Excel文档,应该要先了解openpyxl提供的三个类:

  • Workbook类用来创建工作簿、读取、创建,删除,复制工作表等。

  • load_workbook方法会读取已存在的工作簿,返回Workbook对象

  • Worksheet类用来进行表的操作,比如访问单元格。返回Cell对象。