大数定律(2)：切比雪夫不等式

Markov不等式有一个很简洁的结果，但是它有一个不近人情的前提条件。它要求随机变量取正值。这通常是没法满足的。为此，我们需要对现有的随机变量进行一些改造，构造一个随机变量的函数。那么什么函数必取正值呢？最常用的是偶次数幂函数，以及指数函数。这就分别得到了切比雪夫不等式和切诺夫界。本文介绍切比雪夫不等式。

定理2. 对任意的期望有界的随机变量，都有

Pr {| X - E [X] | > c} \leq v a r ( X ) c 2

$\Pr\{|X-E[X]| > c\} \leq \frac{var(X)}{c^2}$
对所有的

c>0 $c>0$ 成立，其中

v a r (X) = E [X - E [X]] 2

$var(X)=E[X-E[X]]^2$
是随机变量

X $X$ 的方差。

证明： 我们注意到

Pr {| X - E [X] | > c} = Pr {| X - E [X] | 2 > c 2} .

$\Pr\{|X-E[X]| > c\} = \Pr\{|X-E[X]|^2 > c^2\}.$
而

|X−E[X]|2 $|X-E[X]|^2$ 只取正值，因此利用定理1便有定理2成立。

由切比雪夫不等式，我们可以得到第1个大数定律。

推论3. 设 $X_1,X_2,...,X_N$ 是N个i.i.d.的随机变量，它们的概率分布于随机变量 $X$ 的概率分布相同。那么对任意的 $c>0$ 有

Pr {| 1 N \sum i = 1 N X i - E [X] | > c} < v a r ( X ) n c 2 .

$\Pr\{|\frac{1}{N}\sum_{i=1}^NX_i-E[X]|>c\} < \frac{var(X)}{nc^2}.$

证明如果把 $Y=\frac{1}{N}\sum_{i=1}^NX_i$ 看做是一个随机变量，其期望

E [Y] = E [1 N \sum i = 1 N X i] = 1 N \sum i = 1 N E [X i] = 1 N \sum i = 1 N E [X] = E [X],

$E[Y]=E[\frac{1}{N}\sum_{i=1}^NX_i]=\frac{1}{N}\sum_{i=1}^NE[X_i]=\frac{1}{N}\sum_{i=1}^NE[X]=E[X],$
其方差

v a r (Y) = = = = v a r [1 N \sum i = 1 N X i] 1 N 2 \sum i = 1 N v a r [X i] 1 N 2 \sum i = 1 N v a r [X] v a r [ X ] N .

$\begin{array}{lll} var(Y)&=&var[\frac{1}{N}\sum_{i=1}^NX_i]\\ &=&\frac{1}{N^2}\sum_{i=1}^N var[X_i]\\ &=&\frac{1}{N^2}\sum_{i=1}^Nvar[X]\\ &=&\frac{var[X]}{N}. \end{array}$
结合定理2，便有推论成立。

推论3告诉我们，如果随机变量 $X$ 的方差有界，并且我们依随机变量 $X$ i.i.d.地生成 $N$ 个样本。那么当 $N$ 充分大时，有很大的概率，这N个样本的均值落在 $X$ 的期望附近。这也是依概率收敛的意义。

注意：切比雪夫不等式考虑的是随机变量的二阶中心距，也即方差。事实上我们还可以考虑任意偶次阶中心距。更确切地

Pr {| X - E [X] | > c} \leq E [ X - E [ X ] ] 2 k c 2 k

$\Pr\{|X-E[X]| > c\} \leq \frac{E[X-E[X]]^{2k}}{c^{2k}}$
对任意的正整数

k $k$ 成立。

大数定律(2)：切比雪夫不等式

猜你喜欢