经验分布函数

对样本值进行从大到小排序，可得到 ${x_{(1)}\cdots x_{(n)}}$ 的有序样本。定义

F_{n} (x) = {\begin{cases} 0, & x < x_{(1)}, \\ \frac{k}{n}, & 当 x_{(k)} \leq x < x_{(k + 1)}, k = 1, 2, . . ., n - 1, \\ 1, & 当 x \geq x_{(n)} \end{cases}

$F_n(x)=\begin{cases} 0, & x<x_{(1)},\\ \frac{k}{n}, &当x_{(k)} \leq x <x_{(k+1)},k=1,2,...,n-1, \\ 1, &当x \geq x_{(n)} \end{cases}$
为经验分布函数，其满足分布函数的性质：

单调不减
有界性
右连续性

下面给个例子：下面有容量为5的样本数据：

351 347 355 344 351
经排序可得有序样本：

x_{(1)} = 344 x_{(2)} = 347 x_{(3)} = 351 x_{(4)} = 351 x_{(5)} = 355

$x_{(1)}=344 x_{(2)}=347 x_{(3)}=351 x_{(4)}=351 x_{(5)}=355$
其经验分布函数为

F_{n} (x) = {\begin{cases} 0, & x < 344, \\ 0.2, & 344 \leq x < 347, \\ 0.4, & 347 \leq x < 351, \\ 0.8, & 351 \leq x < 355, \\ 1, & 当 x \geq 355 \end{cases}

$F_n(x)=\begin{cases} 0, & x<344,\\ 0.2, &344\leq x<347, \\ 0.4, &347\leq x<351, \\ 0.8, &351\leq x<355, \\ 1, &当x \geq 355 \end{cases}$
这里写图片描述

可以看得到经验分布函数为阶梯函数。想象一下当样本数增多时，经验分布函数的阶梯数不断增多，最后会趋近于一个光滑分布函数的形状（但并不光滑）。为什么要定义经验分布函数呢？接下来介绍一个最重要的定理： 格里纹科定理。
设

x_{1}, x_{2}, . . . x_{n}

$x_1,x_2,...x_n$ 是取自总体分布函数为F(x)的样本，

F_{n} (x)

$F_n(x)$ 是其经验分布函数，当

n \to \infty

$n\rightarrow\infty$ 时，有

P (s u p_{- \infty < x < \infty} | F_{n} (x) - F (x) | \to 0) = 1

$P(sup_{-\infty<x<\infty}|F_n(x)-F(x)|\rightarrow0)=1$
也即是说当n足够大时，经验分布函数是总体分布函数F(x)的一个良好的近似。格里纹科定理表明，当样本数足够多时，用样本估计总体是合理的，这即是数理统计的基础。

下面举个例子，在R里不断生成标准正态随机数，我们观察经验分布函数的图像：
当n=10时：
这里写图片描述
当n=20时：

当n=50时：

当n=100时：

当n=1000时：

可以看到随着样本数增加，经验分布函数逐渐趋向于一条光滑的分布函数曲线。理论上来说也是由格里纹科定理保证的。

经验分布函数与格里纹科定理

经验分布函数

猜你喜欢