下面的代码使用到了扩展库openpyxl来读取xlsx文件,需要使用pip进行安装。
'''根据电影、导演、演员清单,统计每个演员的参演电影'''
import openpyxl
from openpyxl import Workbook
def getActors(filename):
actors = dict()
# 打开xlsx文件,并获取第一个worksheet
wb = openpyxl.load_workbook(filename)
ws = wb.worksheets[0]
# 遍历Excel文件中的所有行
for index, row in enumerate(ws.rows):
# 绕过第一行的表头
if index == 0:
continue
# 获取电影名称和演员列表
filmName, actor = row[0].value, row[2].value.split(',')
# 遍历该电影的所有演员,统计参演电影
for a in actor:
actors[a] = actors.get(a, set())
actors[a].add(filmName)
return actors
actors = getActors('电影导演演员.xlsx')
actors = sorted(actors.items(), key=lambda x:int(x[0][2:]))
for item in actors:
print(item)