方差(Variance):一个随机变量的方差描述的是它的离散程度,也就是该变量离其期望值的距离。将各个误差将之平方(而非取绝对值,使之肯定为正数),相加之后再除以总数。公式如下:
pandas官方文档对 var() 定义:DataFrame.var
(axis=None, skipna=None, level=None, ddof=1, numeric_only=None, **kwargs)
pandas 默认 ddof=1, 即分母为N-1,这样的样本方差是总体方差的无偏估计。这被称为贝塞尔修正。
numpy官方文档var() 定义: numpy.var
(a, axis=None, dtype=None, out=None, ddof=0, keepdims=<no value>)
numpy默认 ddof=0, 即分母为N。
标准差(又称标准偏差、均方差,英语:Standard Deviation,缩写SD),数学符号σ(sigma),在概率统计中最常使用作为测量一组数值的离散程度之用。标准差定义:为方差开算术平方根,反映组内个体间的离散程度;标准差与期望值之比为标准离差率。
pandas官方文档对 std() 定义:DataFrame.std
(axis=None, skipna=None, level=None, ddof=1, numeric_only=None, **kwargs)
numpy.
std
(a, axis=None, dtype=None, out=None, ddof=0, keepdims=<no value>)