分组分析:是指根据分组字段,将分析对象划分成不同的部分,已进行对比分析各组之间的差异性的一种分析方法
常见的统计指标:
计数
求和
平均值
1 函数
01 分组统计函数:
groupby(by=[分组列1,分组列2,...])[统计列1,统计列2,。。。]
.agg({统计列名1:统计函数1,统计列名2:统计函数2,。。。})
参数说明:
by: 用于分组的列
中括号:用于统计的列
agg: 统计别名显示统计值的名称,统计函数用于统计数据
02 常用统计函数 注释
size 计数
sum 求和
mean 均值
2 案例说明
import pandas
data=pandas.read_csv(
'D:\\DATA\\pycase\\5.2分组分析\\data.csv',
engine='python',
sep=',',
encoding='utf8'
)
# 分组进行统计
# by 后边是分组列,score是统计列
import numpy
aggResule=data.groupby(
by=['class']
)['score'].agg({
'总分': numpy.sum,
'人数': numpy.size,
'平均值': numpy.mean
})