您当前的位置:首页 > 计算机 > 编程开发 > Python

Python读取Excel文件统计演员参演电影

时间:12-25来源:作者:点击数:

假设有个Excel 2007文件“电影导演演员.xlsx”,其中有三列分别为电影名称、导演和演员列表(同一个电影可能会有多个演员,每个演员姓名之间使用逗号分隔),现在要求统计每个演员的参演电影分别是哪些。

下面的代码使用到了扩展库openpyxl来读取xlsx文件,需要使用pip进行安装。

'''根据电影、导演、演员清单,统计每个演员的参演电影'''
import openpyxl
from openpyxl import Workbook

def getActors(filename):
    actors = dict()
    # 打开xlsx文件,并获取第一个worksheet
    wb = openpyxl.load_workbook(filename)
    ws = wb.worksheets[0]
    # 遍历Excel文件中的所有行
    for index, row in enumerate(ws.rows):
        # 绕过第一行的表头
        if index == 0:
            continue
        # 获取电影名称和演员列表
        filmName, actor = row[0].value, row[2].value.split(',')
        # 遍历该电影的所有演员,统计参演电影
        for a in actor:
            actors[a] = actors.get(a, set())
            actors[a].add(filmName)
    return actors

actors = getActors('电影导演演员.xlsx')
actors = sorted(actors.items(), key=lambda x:int(x[0][2:]))
for item in actors:
    print(item)

代码执行结果为:

方便获取更多学习、工作、生活信息请关注本站微信公众号城东书院 微信服务号城东书院 微信订阅号
推荐内容
相关内容
    无相关信息
栏目更新
栏目热门