1.正态总体下常见的抽样分布
本人博客:总体分布、样本分布、抽样分布的区别
本人博客:三大抽样分布
正态总体下常见的抽样分布意思是:样本来自服从正态分布的总体中,从样本中抽样后得到的分布
1.1 单个正态总体下的抽样分布:正态分布
设总体 X ∼ N ( μ , σ 2 ) X\sim N(\mu,\sigma^2) X∼N(μ,σ2), X 1 , X 2 , ⋯ , X n X_1,X_2,\cdots,X_n X1,X2,⋯,Xn 是来自总体X的样本(独立且同分布),样本均值为 X ˉ \bar{X} Xˉ
样本均值服从的分布为: X ˉ ∼ N ( μ , σ 2 n ) \bar{X} \sim N(\mu,\frac{\sigma^2}{n}) Xˉ∼N(μ,nσ2)(正态分布)
服从正态分布的各个随机变量线性组合仍为正态分布
可以将样本均值(随机变量)标准化:
X ˉ − μ σ / n ∼ N ( 0 , 1 ) \frac{\bar{X}-\mu}{\sigma/\sqrt{n}}\sim N(0,1) σ/nXˉ−μ∼N(0,1)
若将上述标准化后的随机变量进行平方,则处理后服从自由度为1的卡方分布
( X ˉ − μ σ / n ) 2 ∼ χ 2 ( 1 ) \big(\frac{\bar{X}-\mu}{\sigma/\sqrt{n}}\big)^2\sim \chi^2(1) (σ/nXˉ−μ)2∼χ2(1)
1.2 单个正态总体下的抽样分布:自由度为 n 的卡方分布
设总体 X ∼ N ( μ , σ 2 ) X\sim N(\mu,\sigma^2) X∼N(μ,σ2), X 1 , X 2 , ⋯ , X n X_1,X_2,\cdots,X_n X1,X2,⋯,Xn 是来自总体X的样本(独立且同分布)
若将每个样本(随机变量)进行标准化后平方再进行加和,则服从自由度为n的卡方分布
∑ i = 1 n ( X i − μ ) 2 σ 2 ∼ χ 2 ( n ) \frac{\sum_{i=1}^{n}(X_i-\mu)^2}{\sigma^2}\sim \chi^2(n) σ2∑i=1n(Xi−μ)2∼χ2(n)
1.3 单个正态总体下的抽样分布:自由度为 n-1 的卡方分布
设总体 X ∼ N ( μ , σ 2 ) X\sim N(\mu,\sigma^2) X∼N(μ,σ2), X 1 , X 2 , ⋯ , X n X_1,X_2,\cdots,X_n X1,X2,⋯,Xn 是来自总体X的样本(独立且同分布),样本均值为 X ˉ \bar{X} Xˉ,样本方差为 S 2 S^2 S2, X ˉ \bar{X} Xˉ 与 S 2 S^2 S2 相互独立
下图来自《统计学图鉴》中对自由度的理解
样本方差 S 2 S^2 S2本身是不遵循概率分布的,为了能让它遵循卡方分布,我们需要将其变换为与样本方差 S 2 S^2 S2成比例的统计量(卡方分布)
n B 2 σ 2 = ( n − 1 ) S 2 σ 2 = ∑ i = 1 n ( X i − X ˉ ) 2 σ 2 ∼ χ 2 ( n − 1 ) \frac{nB_2}{\sigma^2}=\frac{(n-1)S^2}{\sigma^2}=\frac{\sum_{i=1}^{n}(X_i-\bar{X})^2}{\sigma^2}\sim \chi^2(n-1) σ2nB2=σ2(n−1)S2=σ2∑i=1n(Xi−Xˉ)2∼χ2(n−1)
注意区分下图中两个式子:
区别:一个是总体均值(数值) μ \mu μ,一个是样本均值(随机变量) X ˉ \bar{X} Xˉ
∑ i = 1 n ( X i − μ ) 2 σ 2 ∼ χ 2 ( n ) ∑ i = 1 n ( X i − X ˉ ) 2 σ 2 ∼ χ 2 ( n − 1 ) \frac{\sum_{i=1}^{n}(X_i-\mu)^2}{\sigma^2}\sim \chi^2(n)\\ ~\\ \frac{\sum_{i=1}^{n}(X_i-\bar{X})^2}{\sigma^2}\sim \chi^2(n-1) σ2∑i=1n(Xi−μ)2∼χ2(n) σ2∑i=1n(Xi−Xˉ)2∼χ2(n−1)
1.4 两个正态总体下的抽样分布:自由度为 n 的 t 分布
X Y 1 2 + Y 2 2 + ⋯ + Y n 2 n ∼ t ( n ) \frac{X}{\sqrt{\frac{Y_1^2+Y_2^2+\cdots+Y_n^2}{n}}}\sim t(n) nY12+Y22+⋯+Yn2X∼t(n)
1.5 单个正态总体下的抽样分布:自由度为 n-1 的 t 分布
设总体 X ∼ N ( μ , σ 2 ) X\sim N(\mu,\sigma^2) X∼N(μ,σ2), X 1 , X 2 , ⋯ , X n X_1,X_2,\cdots,X_n X1,X2,⋯,Xn 是来自总体X的样本(独立且同分布),样本均值为 X ˉ \bar{X} Xˉ,样本方差为 S 2 S^2 S2, X ˉ \bar{X} Xˉ 与 S 2 S^2 S2 相互独立
X ˉ − μ S / n ∼ t ( n − 1 ) \frac{\bar{X}-\mu}{S/\sqrt{n}}\sim t(n-1) S/nXˉ−μ∼t(n−1)
若将上述随机变量平方,则其服从F分布
( X ˉ − μ S / n ) 2 ∼ F ( 1 , n − 1 ) \big(\frac{\bar{X}-\mu}{S/\sqrt{n}}\big)^2\sim F(1,n-1) (S/nXˉ−μ)2∼F(1,n−1)
1.6 小结:单个正态总体下的抽样分布
1.7 两个正态总体下的抽样分布:自由度为 n 1 + n 2 − 2 n_1+n_2-2 n1+n2−2 的 t 分布
1.8 两个正态总体下的抽样分布: F ( n 1 − 1 , n 2 − 1 ) F(n_1-1,n_2-1) F(n1−1,n2−1)