总体(或母体)
所研究的对象的全体。
个体
这里是引用
总体中的元素。
有限总体
总体中的个体数目为有限。
无限总体
总体中的个数数目为无线。
数理统计
关心的是某一项或若干项数量指标X(向量)和该数量指标X在总体中的分布情况。–“所谓的总体的分布就是数量指标X的分布”
扫描二维码关注公众号,回复:
4927252 查看本文章
样本及其分布
样本
从总体中取得一部分个体,这一部分个体成为样本(或子样)
样品
样本中的每个个体称为样本
样本容量
样本中的个体数目称为样本容量
抽样
取得样本的过程
抽样法
抽样中采用的方法
随机抽样法
从总体中随意的抽取若干个个体–一般采用此方法
样本空间
总体X随机抽样的到的样本按顺序排序用X1…Xn表示,或者用n维随即向量
X=
(X1,⋯,Xn)T表示.
样本
(X1,⋯,Xn)T可能取值的全体成为样本空间
i.i.d.
独立同分布
简单随机样本
X1的分布与总体X的分布相同
分布-对于简单随机样本X1…Xn
若总体的分布函数为F(x)则样本的联合分布函数为:
Fs(x1,⋯,xn)=∏i=1nF(xi)
若总体的概率密度f(x)则样本的联合概率密度为:
fs(x1,⋯,xn)=∏i=1nf(xi)
若总体具有分布律(概率函数)p(x),其中p(ai) = P(X = ai),则样本的联合概率函数为:
ps(x1,⋯,xn)=∏i=1np(xi)
统计量
样本均值
Xˉ=n1∑i=1nXi
样本方差
S2=n1∑i=1n(Xi−X)2=n1∑i=1nXi2−X2
修正样本方差
S∗2=n−11∑i=1n(Xi−X)2
样本k阶原点矩
Ak=n1∑i=1nXik
样本k阶中心距
Bk=n1∑i=1n(Xi−X)k
X(k)的概率密度f(k)(x)(1<=k<=n)
f(k)(x)=(k−1)!(n−k)!n![F(x)]k−1[1−F(x)]n−kf(x)
X(k)与X(j)的联合概率密度f(k)(j)(x,y)(1<=k<=j<=n)
f(k)(j)(x,y)=(k−1)!(j−k−1)!(n−j)!n![F(x)]k−1[F(y)−F(x)]j−k−1[1−F(y)]n−jf(x)f(y)
在顺序统计量中
样本中位数
Me={21(Xn/2+X(n/2+1)),n为偶数X((n+1)/2),n为奇数
观察值为
me={21(xn/2+x(n/2+1)),n为偶数x((n+1)/2),n为奇数
样本极差
R=X(n)−X(1)
其观察值为
r=x(n)−x(1)
经验分布函数
抽样分布
所谓抽样分布是指统计量的概率分布,确定统计量的分布是数理统计学的基本问题之一.一般情况下,统计量分布的推导问题可分为两种情况进行讨论:(1)当已知总体X的分布时,若对任意容量为n的样本
X1,...Xn能求出统计量g(
X1,...Xn)的分布,则称该分布为g(
X1,...Xn)的精确分布.确定统计量的精确分布,对于数理统计中的所谓小样问题(指样本容量n较小时的统计问题)的研究是很重要的;(2)当n->∞时,能求出统计量g(
X1,...Xn)的极限分布.统计量的极限分布对于数理统计中得到的所谓大样问题(指样本容量n较大时的统计问题)的研究是非常有用的.
Γ分布
若随机变量X具有概率密度
f(x,α,λ)={0,x≤0Γ(α)λαxα−1e−λx,x>0
则成X服从参数为α、λ的Γ分布,记为
X∼Γ(α,λ),其中α>0,λ>0为参数.
Γ函数
Γ(α)=∫0+∞xα−1e−xdx
Γ引申
Gamma(α+1)=αΓ(α)(因而Γ(n+1)=n!)
Γ(1)=1
Γ(21)=π
Γ(p+q)Γ(p)Γ(q)=B(p,q)
性质1
若
X∼Γ(α,λ),则
E(X)=λα,D(X)=λ2α.
性质2(可加性)
若Xi∼Γ(αi,λ),i=1,⋯,n,且X1,⋯,Xn相互独立,则:
X1+⋯+Xn∼Γ(α1+⋯+αn,λ).
β分布
若随机变量X具有概率密度
f(x;α,b)={0,其他B(a,b)xa−1(1−x)b−1,0<x<1
则称X服从参数为a、b的β分布,记为
X∼β(a,b),其中a>0,b>0为参数.
β函数
B(p,q)=∫01xp−1(1−x)q−1dx
性质1
若
X∼β(a,b),则
E(X)=a+ba,D(X)=(a+b)2(a+b+1)ab
性质2
若
X∼Γ(a,1),Y∼Γ(b,1)且X,Y相互独立,则
Z=X+YX∼β(a,b)
χ2分布
若随机变量X具有概率密度
χ2(x;n)={0,x≤022nΓ(2n)x2n−1e−2x,x>0
则称X服从自由度为n的
χ2分布,记为
X∼χ2(n).随机变量X称为
χ2变量.
性质1
若
X∼χ2(n),则
E(X)=n,D(X)=2n.
性质2(可加性)
若Xi∼χ2(ni),i=1,⋯,k且Xi,⋯,Xk相互独立,则
X1+⋯+Xk∼χ2(n1+⋯+nk).
定理
设随机变量
X1,⋯,Xn相互独立,且都服从标准正态分布N(0,1),则随机变量
χ2=∑i=1nXi2服从自由度为n的
χ2分布,即
χ2∼χ2(n)
t分布
若随机变量T具有概率密度
t(x;n)=nπ
Γ(2n)Γ(2n+1)(1+nx2)−2n+1,−∞<x<+∞
则称T服从自由度为n的t分布,记为T~t(n).t分布又称为学生分布.
定理
若X∼N(0,1),Y∼χ2(n),且X与Y相互独立,则
T=nY
X∼t(n)
F分布
若随机变量F具有概率密度
f(x;n1,n2)={0,x≤0Γ(2n1)Γ(2n2)Γ(2n1+n2)(n2n1)(n2n1x)2n1−1(1+n2n1x)−2n1+n2,x>0
则称F服从自由度为
(n1,n2)的F分布,记为
F∼F(n1,n2).
定理
若X∼χ2(n1),Y∼χ2(n2),且X与Y相互独立,则
F=n2Yn1X∼F(n1,n2)
推论
在定理的条件下,若F∼F(n1,n2),则F1∼F(n2,n1).
分位数
设随机变量X的分布函数为F(x)=P{X≤x},对于0<p<1,若有xp满足
P{X≤xp}=F(xp)=p
则称xp为分布F(x)(或随机变量X)的下侧p分位数;对于0<α<1,若有yα满足
P{X>yα}=1−F(yα)=α
则称yα为分布F(x)(或随机变量X)的上侧α分位数.
由定义可知,yα=x1−α;xp=y1−p
正态总体的抽样分布
定理1
设X1,⋯,Xn是来自正态总体N(μ,σ2)的样本,X为样本均值,S∗2为修正样本方差,则
(1)
X∼N(μ,nσ2);
(2)
σ2(n−1)S∗2=σ2nS2=σ21∑i=1n(Xi−X)2∼χ2(n−1);
(3)
X与S∗2相互独立
定理2
设X1,⋯,Xn为正态总体N(μ,σ2)的样本,X为样本均值,S∗2为修正样本方差,则
T=S∗n
(X−μ)∼t(n−1)
定理3
设X1,⋯,Xn1和Y1,⋯,Yn2分别为正态总体N(μ1,σ2)和N(μ2,σ2)的样本,且两样本相互独立,记
X=n11∑i=1n1Xi,Y=n21∑i=1n2Yi,S1n1∗2=n1−11∑i=1n1(Xi−X)2,S2n2∗2=n2−11∑i=1n2(Yi−Y)2,则有
T=Sωn11+n21
(X−Y)−(μ1−μ2)∼t(n1+n2−2)
其中
Sω=n1+n2−2(n1−1)S1n1∗2+(n2−1)S2n2∗2
定理4
设X1,⋯,Xn1和Y1,⋯,Yn2分别为正态总体N(μ1,σ12)和N(μ2,σ22)的样本,且两样本相互独立,S1n1∗2和S2n2∗2分别为两个样本各自的修正方差,则
F=σ12S2n2∗2σ22S1n1∗2∼F(n1−1,n2−1)
定理5(柯赫伦)-该定理在方差分析和回归分析中具有重要作用.
设X1,⋯,Xn是n个相互独立的标准正态变量,记Q=∑i=1nXi2.若Q可以分解为Q=Q1+⋯+Qk其中Qi(i=1,⋯,k)是X1,⋯,Xn的秩为ni的非负定二次型,
则Q1,⋯,Qk相互独立,且Qi∼χ2(ni)(i=1,⋯,k)的充分必要条件是∑i=1kni=n
正态标准化
X∼N(μ,σ2)
σX−μ∼N(0,1)
Xˉ∼N(μ,nσ2)
σn
(Xˉ−μ)∼N(0,1)
置信区间(
X-△,
X+△)
当
σ已知
△=
μ2αn
σ
当
σ未知
△=
t2α(n−1)n
S
各种分布的方程
二项分布X~B(n,p),则随机变量X的分布列为
P(X=k)=
Cnkpk (1-p)n-k k=0,1,…,n
μ=np
σ2=npq
泊松分布X~P(λ)
P(X=k)=
k!λke−λ,λ>0,k=0,1…
μ=λ
σ2=λ
均匀分布X~U(a,b)
f(x)={b−a10,其他,a≤x≤b
μ=2a+b
σ2=12(b−a)2
指数分布X~Exp(λ)
f(x)={λe−λx,x>00,x≤0
μ=λ1
σ2=λ21
正态分布X~(
μ,σ2)
f(x)=σ2π
1e−2σ2(x−μ)2
用概率密度求均值
μ=概率密度的积分
用极差R求标准差的估计
σ^=dnR n为样本个数
dn可查表得