2025年6月4日 星期三 乙巳(蛇)年 三月初八 设为首页 加入收藏
rss
您当前的位置:首页 > 计算机 > 编程开发 > Python

读取Excel文件,获取每个用户各种操作类型的最新记录(基于python实现)

时间:05-27来源:作者:点击数:12

要从 Excel 文件中读取用户操作日志,并获取每个用户各种操作类型的最新记录,然后将结果输出到另一个 Excel 文件中,你可以使用 pandas 库。以下是实现这一功能的完整代码示例:

示例代码

  • import pandas as pd
  • # 读取 Excel 文件
  • input_file_path = 'user_logs.xlsx'
  • output_file_path = 'latest_user_operations.xlsx'
  • df = pd.read_excel(input_file_path)
  • # 确保 operation_time 列是 datetime 类型
  • df['operation_time'] = pd.to_datetime(df['operation_time'])
  • # 获取每个用户每种操作类型的最新操作记录
  • latest_operations = df.sort_values('operation_time', ascending=False).drop_duplicates(subset=['user_id', 'operation_type'], keep='first')
  • # 将结果输出到另一个 Excel 文件
  • latest_operations.to_excel(output_file_path, index=False)
  • print(f"最新操作记录已保存到 {output_file_path}")

说明

  1. 读取 Excel 文件
    • 使用 pd.read_excel(input_file_path) 读取 Excel 文件,生成一个 DataFrame。
    • 确保 operation_time 列被转换为 datetime 类型,以便进行时间排序。
  2. 获取最新操作记录
    • 使用 sort_values 方法按 operation_time 降序排序。
    • 使用 drop_duplicates 方法去除重复的用户和操作类型记录,仅保留每个用户每种操作类型的第一条记录(即最新的记录)。
  3. 输出到 Excel 文件
    • 使用 to_excel 方法将结果 DataFrame 输出到新的 Excel 文件中。
    • index=False 参数用于避免将索引写入 Excel 文件。

依赖安装

在运行上述代码之前,请确保安装了 pandas 和 openpyxl(用于处理 Excel 文件):

  • pip install pandas openpyxl

注意事项

  • 确保输入和输出的 Excel 文件路径正确。
  • 如果 Excel 文件中有多个工作表,你可以通过 sheet_name 参数指定需要读取的工作表。
  • 如果 Excel 文件格式或列名不同,需要相应调整代码中的列名。
方便获取更多学习、工作、生活信息请关注本站微信公众号城东书院 微信服务号城东书院 微信订阅号
推荐内容
相关内容
栏目更新
栏目热门
本栏推荐