本文的最重要的一个定理,中心极限定理(CLT):
任何函数多次与自身进行卷积运算之后,都会逼近某高斯分布,即
limn→∞f(x)∗...∗f(x)=limn→∞f∗n(x)=12π−−√σe−(x−μ)22σ2
为了方便起见,我们将标准正态分布的情况,更一般的证明可以通过本文证明的标准正态分布通过缩放、位移得到。
我们回忆一下概率论几个定义或定理:
设
p(x)
为概率密度分布,
P(a≤x≤b)
为
X
在
[a,b]
内的概率,则
p(x)≥0
P(a≤x≤b)=∫bap(x)dx
F(x)=P(X≤x)=∫x−∞p(x)dx
P(−∞≤x≤+∞)=1
,
平均值x¯¯¯=∫∞−∞xp(x)dx
,
标准差s=∫∞−∞x2p(x)dx
若
X
的概率密度为
f(X)
,则
aX
的概率密度为
1af(Xa)(1)
简单证明一下最后一条:
设
X
的概率密度为
f(X)
,则对于
Y=kX,k>0
F(y)=P(Y≤y)=P(kX≤y)=P(X≤yk)=∫yk−∞p(x)dx
对其求导,利用定积分求导公式可得:
f(y)=dF(y)dy=p(yk)d(yk)dy−limc→−∞p(c)dcdy=1kp(yk)
将变量
y
用变量
x
替换即得证
设
X1
,
X2
为独立的随机变量,那么
P(X1+X2≤t)=∬X1+X2≤tp1(X1)p2(X2)dX1dX2
令
u=X1,v=X1+X2
,则
X1=u,X2=v−u
,运用雅可比变换,有:
P(X1+X2≤t)=∬v≤tp1(u)p2(v−u)∣∣∣∣∂X1∂u∂X2∂u∂X1∂v∂X2∂v∣∣∣∣dudv=∫t−∞∫+∞−∞p1(u)p2(v−u)dudv=∫t−∞(p1∗p2)(v)dv
因此,
X1+X2
的概率密度,就是
p1
与
p2
的卷积
不难证明,
X1+⋯+Xn
的概率密度,可以由
p1∗⋯∗pn
来表示,即
p(X1+⋯+Xn)=p1∗⋯∗pn(2)
我们设
X1+⋯+Xn
有相同的概率分布
p(x)
(即独立同分布iid)。方便起见,设他们分别的平均值为
0
,标准差为
1
,即:
x¯¯¯=∫∞−∞xp(x)dx=0
s=∫∞−∞x2p(x)dx=1
设
S=X1+⋯+Xn
,则
S
的平均值为
0
,方差为
1
,标准差为
n−−√
接下来我们证明中心极限定理(CLT):
设
pn(x)
为
Sn√
的概率密度(这样标准差就为
1
),则
limn→∞pn(x)=12π−−√e−x22
证明如下:
由
(2)
式可知,
p(S)=p1∗⋯∗pn
,而
pn(x)
相当于
p(S)
的缩放,根据
(1)
知,
pn(x)=n−−√p(n−−√S)=n−−√p∗n(n−−√x)
对进行傅里叶变换,并根据傅里叶变换的拉伸性,有:
F(pn(x))=n−−√F(p∗n(n−−√x))=n−−√(1n−−√(F(p∗n))(sn−−√))=(F(p∗n))(sn−−√)=(Fp)n(sn−−√)=(Fp(sn−−√))n(3)
我们将
Fp(sn√)
展开,有:
Fp(sn−−√)=∫+∞−∞e−2πi(sn√)xp(x)dx
对
e−2πi(sn√)x
用泰勒展开,有:
Fp(sn−−√)=∫+∞−∞[1−2πisxn−−√−12(2πsxπ−−√)2+…]p(x)dx=∫+∞−∞p(x)dx−2πisn−−√∫+∞−∞xp(x)dx−=1−0−2π2s2n+o(1n−−√3)
显然,当
n→∞
时,
Fp(sn√)≈1−2π2s2n
,将其带入
(3)
式,可得
(Fp(sn−−√))n≈(1−2π2s2n)n=((1+−2π2s2n)n−2π2s2)−2π2s2=e−2π2s2
对其进行傅里叶逆变换,运用傅里叶变换的拉伸性对高斯函数进行拉伸可得:
limn→∞pn(x)=12π−−√e−x22
得证。