统计学(三)期望(Expectation)
本章内容:
- 3.1 随机变量的期望
- 3.2 期望的性质
- 3.3 方差(Variance)和协方差(Covariance)
- 3.4 几个重要随机变量的期望和方差
- 3.5 条件期望
- 3.6 矩生成函数(Moment Generating Function)
关键名词,存在部分词不达意的情况,因此将关键名词整理如下
1. 期望:Expectation
2. 方差:Variance
3. 协方差:Covariance
4. 均值:Mean
5. 一阶矩:First Moment
6. 分部积分:Integration by parts
7. 无意识统计学家法则:Law of the unconscious statistician
8. 矩:Moment
9. 标准差:standard deviation
10. 样本均值: sample mean
11. 样本方差:sample variance
12. 相关性:correlation
13. 条件期望:Conditional Expectation
14. 期望迭代定理:The Rule of Iterated Expectations
15. 条件方差:Conditional Variance
16. 层次模型:hierarchical model
17. 矩生成函数:Moment Generating Function
18. 拉普拉斯变换:Laplace transform
3.1 随机变量的期望
随机变量X的均值(mean),期望(expectation)就是是X的平均数
3.1 定义
随机变量X的期望值(expected value),或者均值(mean),或者一阶矩(first moment)定义如下:
其中,假定求和(或者积分)符合定义.我们使用下面的式子表示X的期望值:
期望是对分布的一种单值概括.将视为许多独立同步分布的X1,X2,...Xn的平均值.事实上,将不仅仅是一种启发,而且还是一种被称为大数定律的定理.它将在第五章中介绍.
符号需要做一些说明.我们使用它仅仅是作为一种方便的统一的符号,这样我们就不必为离散随机变量写成,为连续随机变量写成.但是你应该知道,这个符号在实际的分析课程中,有精确的含义.
为了保证符合定义,如果,我们就说存在.否则我们就说期望不存在.
3.2 例子
设,那么
3.3 例子
抛硬币,两次.设X是正面朝上的次数.那么
3.4 例子
设,那么,
3.5 例子
回顾一下,如果一个随机变量服从柯西分布,那么它就有如下的密度函数:
使用分部积分法(integration by parts)(令),得
因此均值不存在.如果你多次模拟柯西分布并取平均值,你会发现平均值永远不会稳定下来.这是因为柯西分布具有厚尾(thick tails)特性,因此极端观测值很常见。
从现在开始,每当我们讨论期望值时,我们会默认它们是存在的。
设,那么怎么计算呢?一种方法是找到然后通过.但还有更容易得方法.
3.6 定理
无意识统计学家法则(Law of the unconscious statistician).设,那么
这个结果是符合直觉的.考虑我们玩一个游戏的情况,在游戏中你随机抽取X,然后我支付给你Y=r(X).你的平均收入是r(X)乘以X=x的概率,在x上面求和(或者积分).这里有一个特例,设A是一个事件.并且令,如果,且,,那么:
换句话说,概率是期望的一种特例.
3.7 例子
设,,那么.
或者,你可以求出,在的情况下,它为.那么
3.8 例子
拿一根单位长度的棍子,随机折断它。设 Y 为较长部分的长度.那么Y的均值是多少?如果X是这断的点那么.此时.因此,当时.当时,.所以:
多变量函数用同样的方法处理.如那么:
3.9 例子
设(X,Y)在单位正方形上,服从联合均匀分布.再设,那么:
X的第k阶矩(moment) 被定义为:,其中,满足
3.10 定理
如果第k阶矩存在,那么当j<k时,第j阶矩也存在
证明:
第k阶中心矩被定义为:
3.2 期望的性质
3.11 定理
如果X1,...Xn是随机变量,并且a1,...an是常数,那么
3.12 例子
设X服从,那么X的均值是多少,我们可以尝试用定义来求,如下:
上式子求和是比较难的.我们注意到.其中X_i可以表示为第i次抛硬币.当为正面时Xi=1,当为反面时Xi=0.那么.因此:
3.13 定理
设X1,...Xn是独立随机变量,那么:
注意:上面的求和规则,不要求随机变量独立.但是乘积规则则需要随机变量独立
3.3 方差和协方差(Variance and Covariance)
方差衡量了分布的"分布(spread)"程度.(译者注:双引号的"分布"程度,也即分布的集中还是扩散).
3.14 定理
设X是均值为μ的随机变量X.X的方差被定义如下,记作::
如果这个期望存在,那么标准差(standard deviation)为,记作
3.15 定理
如果方差存在且满足定义,那么它具有如下的性质:
1.
2. 如果a和b是常数,那么
3. 如果X1..Xn是独立的,且a1,...,an是常数,那么
3.16 例子
设X服从二项分布.我们记,其中,当正面朝上时,Xi=1,否则Xi=0.且Xi都是独立随机变量.同时,,.可得
现在
因此:.最后
注意:如果p=0,或p=1,那么
如果X1..Xn是随机变量,那么我们可以定义样本均值(sample mean)为:
样本方差(sample variance)定义为:
3.17 定理
设X1,...Xn是独立同分布的随机变量,且,.那么
,,
如果X和Y是随机变量,那么X和Y之间的协方差和相关性衡量了X和Y之间的线性关系有多强。
3.18 定义
设X和Y是均值为,标准差为的随机变量.X,Y之间的协方差定义如下:
相关性(correlation)被定义如下:
3.19 定理
协方差满足:
相关性满足:
如果a,b是常数,,那么当a>0时,;当a<0时
如果X和Y是独立的,那么.一般情况下,逆命题并不成立.
3.20 定理
;,更一般的情况下,对于多个随机变量X1..Xn有:
3.4 几个重要随机变量的期望和方差
下表收录了几个重要随机变量的期望:
前面我们已经推导了二项分布的期望和方差,其他分布的计算,请见课后习题
在上面表格中的最后两项是多元模型,它涉及向量X,格式如下:
随机向量X的均值定义如下:
方差协方差矩阵Σ被定义如下:
X服从,那么.
要理解这一点,需要注意向量任何元素的边缘分布满足二项分布.因此,,也应注意,所以换句话说使用和的方差公式可得
将上式与相等,求得.
最后,这有一个引理,可以用于求出多元随机向量的线性组合的均值和方差,这在某些情况下非常有用。
3.21 引理
如果a是一个向量,X是一个均值为μ,方差为Σ的随机向量.那么,,如果A是一个矩阵,那么,
3.5 条件期望(Conditional Expectation)
假定X,Y是随机变量,当Y=y时,X的均值是多少?答案就是我们按照之前的方法计算X的均值,但在期望的定义中,我们将的替代项更换为。
3.22 定理
在给定Y=y的情况下,X的条件期望被定义为:
如果r(x,y)是x和y的函数,那么
警告:此处有一个细微点需要注意.虽然是一个数值,但是是一个关于y的函数.在得到y值之前,我们并不知道的值,因此他是一个随机变量,记作.换句话说是一个随机变量,它的值为.同样地,也是一个随机变量,它的值为.这是一个非常容易让人困惑的点,因此来看一个例子
3.23 例子
假定X服从均匀分布.在X=x之后,.直观上,我们期望为,事实上,.并且
因此,.注意是一个随机变量,他的值为X=x时的值
3.24 定理(期望迭代定理(The Rule of Iterated Expectations))
对于随机变量X和Y来说,假定期望存在,那么我们就有:
,
更一般的情况下:
证明:
我们使用条件期望和证明第一个等式.
3.25 例子
思考3.23 例子.怎么计算E(Y)?一个方法是找到联合密度函数f(x,y)然后计算.另一个更简单的方法只需要两步.首先已经知道了,因此
3.26 定义
条件方差(conditional variance)被定义如下:
其中,
3.27 定理
对于随机变量X和Y来讲:
3.28 例子
从US中随机抽取一个县,然后再从这个县中随机抽取n个人.设X是这些人中患某种疾病的数量.如果用Q表示该县患有疾病的人口比例,那么Q也是一个随机变量,因为它因县而异。给定Q=q的情况下,我们有.因此..假定随机变量Q服从均匀分布Uniform(0,1).像这样分阶段构建的分布被称为层次模型(hierarchical model),可以写成:
现在.让我们计算X的方差.
现在,让我们来计算这两项
首先,
接下来,
因此
3.6 矩生成函数(Moment Generating Function)
现在,我们将定义矩生成函数,它用于求矩、求随机变量和(sums of random variables)的分布,也用于某些定理的证明中
3.29 定义
矩生成函数(Moment Generating Function)MGF或者拉普拉斯变换(Laplace transform)定义如下:
其中t在实数范围内变化
在下面的内容中,我们假定MGF在t=0附近的开区间内都有定义.
当MGF满足定义时,可以证明:可以交换微分和"取期望值"的操作。这得出
通过进行k次导数运算,我们可以得出.这为我们提供了计算分布的矩的方法
3.30 例子
设X服从指数分布,对于任何的t<1得:
如果,积分会发散.因此当t < 1 时,,现在,
因此,,
3.31 引理
MGF的性质有:
1. 如果Y=aX+b,那么
2. 如果X1,...Xn是独立的,且,那么,其中是Xi的MGF
3.32 例子
设X服从二项分布.我们知道,其中.现在,其中q=1-p.
因此,
回忆前面的内容,如果X和Y有相同的分布函数,那么我们就记作
3.33 定理
设X和Y是随机变量,如果在0点附近的开区间,对于所有的t,都有,那么
3.34 例子
设X1服从二项分布,X2服从二项分布,且两个独立 .令Y=X1+X2,那么得:
我们可以将这个认为二项分布Binomial(n1 + n2, p) 的矩生成函数。因为矩生成函数表征了分布(即,不存在另一个具有相同矩生成函数的随机变量).我们得出结论Y服从二项分布
3.35 例子
设Y1服从泊松分布,Y2服从泊松分布且两者独立.Y=Y1+Y2的矩生成函数为:,他也是的矩生成函数.因此,我们已经证明了两个独立的泊松随机变量的和具有泊松分布
本章完
未翻译:附录,课后作业