在 Python 中,我们可以使用 Pandas 库中的pivot_table 函数来创建和操作数据透视表。基本语法如下:

        pivot_table = pd.pivot_table(data, values='value_column', index='index_column', columns='column_to_aggregate', aggfunc='agg_function').reset_index()

其中:

  • data 是包含原始数据的 DataFrame 对象;
  • values 参数是指定要聚合的数值列;
  • index 参数是指定作为行索引的列;
  • columns 参数是指定作为列索引的列;
  • aggfunc 参数是指定用于聚合的函数,如 'mean'(均值)、'sum'(求和)、'count'(计数)等。
  • reset_index(),重置数据透视表的索引
  • values\index\columns\aggfunc无固定顺序,可按照自己的书写习惯进行书写;

         具体事例如下:假设我们要统计每天的订单总数:(案例中我们没有使用列,所以将其注释掉了)

import pandas as pd 
df = pd.read_csv('/Users/Desktop/test0821.csv')

# 创建数据透视表
pivot_table = pd.pivot_table(df, 
                             values = 'ordid', 
                             index = 'create_time', 
                             #columns='column', 
                             aggfunc='count').reset_index()
pivot_table

Logo

开放原子开发者工作坊旨在鼓励更多人参与开源活动,与志同道合的开发者们相互交流开发经验、分享开发心得、获取前沿技术趋势。工作坊有多种形式的开发者活动,如meetup、训练营等,主打技术交流,干货满满,真诚地邀请各位开发者共同参与!

更多推荐