立即学习:https://edu.csdn.net/course/play/6861/326775?utm_source=blogtoedu
数据汇总
透视表
pd.pivot_table(data, values=None, index=None, columns=None, aggfunc='mean', fill_value=None, margins=False, dropna=True, margins_name='All')
data:数据集
values:要拉入数值的字段列表
index:要拉入行标签的字段列表
columns:要拉入列标签的字段列表
aggfunc:统计函数,默认统计均值
fill_value:填充缺失值
margins:是否显示行或列的总计值
dropna:是否删除整列为缺失的字段
margins_name:指定行或列的总计名称
分组汇总
groupby方法:用于汇总前,设定被分组的变量
要分组的数据集.groupby=(['变量1', '变量2'])
aggregate方法:可基于groupby的结果做进一步统计汇总
分组后的数据集.aggregate=({'变量':方法})
np.min np.max np.size np.mean......
调整变量名顺序
pd.DataFrame(数据集, columns=(['变量名1', '变量名2', '变量名3'])
对变量重新命名
数据集.rename=(colums={'原变量名':'新变量名'}, inplace=True)