基本统计特征函数
下面所说的统计特征函数主要作为Pandas的对象DataFrame或Series的方法出现。
describe 针对Series或个DataFrame列计算汇总统计
count 非na值的数量
min、max 计算最小值和最大值
idxmin、idxmax 计算能够获取到最大值和最小值得索引值
quantile 计算样本的分位数(0到1)
sum 值的总和
mean 值得平均数
median 值得算术中位数(50%分位数)
mad 根据平均值计算平均绝对离差
var 样本值的方差
std 样本值的标准差
corr 样本值的Spearman(Person)相关系数矩阵
skew 样本值得偏度(三阶矩)
kurt 样本值得峰度(四阶矩)
拓展统计特征函数
除了上面基本的统计特征函数之外,Python还提供了一些非常方便的计算统计特征函数。主要有:累计计算(cum),滚动计算(pd.rolling)