部分内容借鉴https://blog.csdn.net/fuming2021118535/article/details/51290320,如有侵权,请联系删除
昨天看文献时,突然想到这个问题:为什么样本平均要除以(n-1)而非n呢?查了文献资料和网上网友的解答,现在彻底明白,现总结如下。
样本方差的计算公式:
但是:为什么样本方差要除以(n-1)而不是除以n?我们知道样本方差之所以要除以(n-1)是因为这样的方差估计量才是关于总体方差的无偏估计量。这个公式是通过修正下面的方差计算公式而来的:
修正过程为:
我们看到的其实是修正后的结果:
无偏估计量。就是说:样本方差的估计量的期望要等于总体方差:
若用未修正的方差公式,它的期望是不等于总体方差的均值(未修正的公式是有偏的):
公式推导过程:
从公式上看到:当,两者才相等,否则必有:
所以如果是用没有修正的样本方差估计量公式来估计总计方差的话是会有偏差,是会低估总体的样本方差。为了能使方差的估计总体无偏,所以要对方差计算公式进行修正:
修正后的估计量是总体方差的无偏估计量,为了能搞懂这种修正是怎么来的,首先我们得有下面几个等式:
1.方差计算公式:
2. 均值的均值、方差计算公式:
对于没有修正的方差计算公式我们有:
因为:
所以有:
在这里如果想修正的方差公式,让修正后的方差公式求出的方差的期望为总体方差的话就需要在没有修正的方差公式前面加上来进行修正,即:
所以就会有这样的修正公式:
而我们看到的都是修正后的最终结果: