国立台湾大学叶丙成《机率》课程学习-chapter4-随机变量-累积分布函数CDF-概率质量函数PMF-伯努利分布-二项分布-均匀分布
视频地址1(需科学上网,有需要可以留言要云分享)
视频地址2-B站
4.1 随机变量
4.1.1 随机变量(random variable,R.V.)定义
随机变量(random variable,R.V.)定义:是一个用来把实验结果(outcome)数字化的表示方式。
存在的意义:可以让概率的推导更数学,更简明
注:随机变数通常使用大写英文字母表示
4.1.2 随机变量的本质
随机变量的本质?函数!
随机变量其实是一个函数,给
X一个outcome,就返回一个对应的数字。数学上的表示法:
X:S→ℜ(映射)
4.1.3 随机变量的种类
- 离散随机变量(Discrete R.V.)
EX1:店员的微笑:
X(笑)=1,X(不笑)=0⇒X=0,X=1
EX2:小美的三个司机:
X(明)=0,X(华)=1,X(圆)=2⇒X=0,X=1,X=2
EX3:小明告白多少次才能成功:
X(0次)=0,X(1次)=1,X(2次)=2,⋯⇒X=0,X=1,X=2,…
注:离散随机变量并不代表只有有限多个case(可以是可数无穷多个)。
- 连续随机变量(continuous R.V)
EX1:幸运之轮:
X可以说
[0,1]之间的任意数字
注:连续随机变量的值是有无穷多个,而且是不可数的无穷多个。
- 什么是可数的,什么是不可数的?
- 可数的:一个集合如果是可数的,这代表它包含的东西是可以一个个被数的,不管用什么方法数它里面的东西,它里面的任意一个东西,总是会被数到的。
EX:正偶数集合
{2,4,6,8,10,…}是可数的,从中随意取一个数字,总是可以数到的。
- 不可数的:一个集合如果是不可数的,这代表它包含的东西是无法可以一个个被数的,不管用什么方法数它里面的东西,它里面一定有一样东西是你没数到的!
EX:0到1之间的所有数字的集合是不可数的!
- 扩展-无穷多的世界:
- EX1:正整数的集合和正偶数的集合相比,哪个集合里面的东西比较多?答案是一样多,正整数的集合中的值乘2即可和正偶数集合产生一一对应关系。
- EX1:“长度为1的线段上的点”与“边长为1的正方形平面上的点”,这两个集合,哪一个点的数量比较多?答案是一样多。
- 注:在无穷多的世界里面,评价两个集合相等,不能使用“你中有我,我中有你”。而是使用是否可以找到一个方法(映射),使两个无穷集合可以找到一个一一对应关系,如果有,两无穷集合是相等的。
4.1.4 随机变量的函数
阿宅若看到店员微笑,就会点200的套餐。如果店员不笑,他就点15的饮料。请问阿宅的消费金额
W是随机变量嘛?
解:店员表情可以由随机变量
X代表:
X(微笑)=0,X(不笑)=15
W是
X的函数:
W(X(微笑))=200,W(X(不笑))=15
所以
W也是喂outcome吐数字!因此,
W也是一个随机变量!
注:随机变量的函数,也是个随机变量
4.2 累积分布函数(cumulative distribution function,CDF)
4.2.1 何谓CDF?
对任一个随机变量
X,我们定义其
CDF为
FX(x)=defP(X≤x)
注:含等号
EX:幸运之轮
FX(0.5)=P(x≤0.5)=21
4.2.2 CDF用处?
- 最有用的用途
计算
X落在某范围内的概率
EX1:如图计算
P(3<X≤5)的概率
可以将其转化为两个
CDF相减,
P(3<X≤5)=P(X≤5)−P(X≤3)
EX2:对比
P(3<X≤5)与
P(3≤X≤5)区别(差一个等号):
P(3≤X≤5)=P(X≤5)−P(X≤3)+P(X=a)
- 离散随机变量的
CDF长什么样?(阶梯状)
EX:
X为骰子的点数,故
P(X=1)=P(X=2)=P(X=3)=P(X=4)=P(X=5)=P(X=6)=21
解:
CDF:FX(x)=P(X≤x)
-
FX(0.3)=P(X≤0.3)=0
-
FX(1)=P(X≤1)=P(X≤1.3)=1
-
FX(2.3)=P(X≤2.3)=P(X≤2.9)=2
- 连续随机变量的
CDF长什么样?
EX:
X为幸运之轮所停下的数字,
x∈[0,1),
解:
CDF:FX(x)=P(X≤x)
-
FX(−0.1)=P(X≤−0.1)=0
-
FX(0.1)=P(0≤X≤0.1)=0.1
-
FX(0.5)=P(0≤X≤0.5)=0.5
-
FX(1)=P(0≤X≤1)=1
-
FX(1.7)=P(0≤X≤1.7)=1
-
P(0.3<x≤0.5)=FX(0.5)−FX(0.3)=0.5−0.3=0.2
-
P(0.3<x<0.5)=FX(0.5−)−FX(0.3)=0.5−0.3=0.2
- 注:
0.5−表示无限接近
0.5的一个点
4.2.3 CDF的性质
- 离散随机变量之
CDF
FX(x+)=FX(x)
FX(x−)=FX(x)−P(X=x)
注1:
x+表示比
x大一点,但无限接近
x的一个值(参考《数学分析》极限定义中的
ϵ)
注2:
x−表示比
x小一点,但无限接近
x的一个值
- 连续随机变量之
CDF
FX(x+)=FX(x)=FX(x−)
- 共同性质
FX(−∞)=P(x≤−∞)=0
FX(+∞)=P(x≤+∞)=1
0≤FX(x)≤1
4.3 概率质量函数(probability mass function,PMF)(离散随机变量特有)
4.3.1 什么是PMF
- 对任一个整数值的离散随机变量
X,我们定义其
PMF为函数:
pX(x)=defP(X=x)
- EX:
X为公平骰子之点数
pX(3)=P(X=3)=61
4.3.2 PMF与CDF的关系(离散随机变量通常只使用整数)
-
FX(2.5)=P(X≤2.5)=P(X=2)+P(X=1)+P(X=0)+P(X=−1)+⋯=∑n=−∞2=∣2.5∣P(X=n)
- 对任何
x
FX(x)=n=−∞∑∣x∣PX(n)
- 相互转化EX1:
PMF→CDF
- 相互转化EX2:
CDF→PMF
阶梯前后的值相减
PX(x)=FX(x+−x−)
- 概率分布(probability Distribution)
任何一个
PMF或是之后介绍的
PDF都当作是一种概率分布(将总和为1的概率分布在点上)
4.4 离散概率分布(discrete probability distributions)
丢硬币:非正即反,正面概率为0.5
阿宅告白:非成功,即失败,成功概率为0.7
出门天气:非晴天即雨天,晴天概率为0.6
相似点:1次实验,两种结果。
只在意某一种结果是否发生
⇒Bernoulli概率分布
4.4.1 Bernoulli概率分布(伯努利分布)
- 举例
- PMF:若实验成功几率为0.6,做一次实验,
X代表成功次数。记为
X∼Bernoulli(0.6)
pX(x)=⎩⎪⎨⎪⎧0.60.40,x=1,,x=0,,otherwise.
- CDF:
FX(x)=∑n=−∞∣x∣pX(x)
FX(x)=⎩⎪⎨⎪⎧00.41,x<0,,0≤x<1,,x≥1.
- 一般化
- PMF:若实验成功几率为
p,做1次实验,
X代表成功次数。记为
X∼Bernoulli(p)
pX(x)=⎩⎪⎨⎪⎧p1−p0,x=1,,x=0,,otherwise.
- CDF:
FX(x)=∑n=−∞∣x∣pX(x)
FX(x)=⎩⎪⎨⎪⎧01−p1,x<0,,0≤x<1,,x≥1.
4.4.2 Binomial概率分布(二项分布)
EX1:阿宅鼓起勇气搭讪10人,若每次搭讪成功几率为0.6,10次成功8次的概率为?
EX2:艺洲五天午餐在某一餐厅就餐,若每次上菜超时的概率为0.9,5天中有3天超时的概率为?
共同点:做n次实验,同一个概率,只关注n次实验出现某结果k次之概率
⇒Binomial概率分布
- 举例
- PMF:若实验成功几率为0.6,做10次实验,
X代表成功次数。记为
X∼BIN(10,0.6)
pX(8)=P(X=8)=(810)0.68(1−0.6)10−8
- CDF:
FX(x)=∑n=−∞∣x∣pX(x)
FX(x)=m=−∞∑∣x∣(m10)0.6m(1−0.6)n−m
- 一般化
- PMF:若实验成功几率为p,做n次实验,
X代表成功次数。记为
X∼BIN(n,p)
pX(x)=P(X=x)=(xn)px(1−p)n−x
- CDF:
FX(x)=∑n=−∞∣x∣pX(x)
FX(x)=m=−∞∑∣x∣(mn)pm(1−p)n−m
4.4.3 Uniform概率分布(均匀分布)
EX1:丢一个公平的骰子:1-6各点出现的概率均等
EX2:混哥考试,作答A,B,C,D的概率均等
EX3:狡兔三窟,出现在三个窟的概率均等
共同点:一次实验,n种结果,个结果概率均等,关注某结果是否发生
⇒Uniform概率分布
- 举例
-
PMF:如果
X等于
3,4,5,6,7的概率均等。记为
X∼UNIF(3,7)
pX(x)=⎩⎨⎧7−3+110,x=3,4,5,6,7,,otherwise.
-
CDF:
FX(x)=∑n=−∞∣x∣pX(x)
FX(x)=⎩⎪⎪⎪⎨⎪⎪⎪⎧06∣x∣−3+11,x<3,,3≤x<8,,x≥8.
- 一般
-
PMF:如果
X等于
a,a+1,…,b的概率均等。记为
X∼UNIF(a,b)
pX(x)=⎩⎨⎧b−a+110,x=a,a+1,…,b,,otherwise.
-
CDF:
FX(x)=∑n=−∞∣x∣pX(x)
FX(x)=⎩⎪⎪⎪⎨⎪⎪⎪⎧0b−a+1∣x∣−a+11,x<a,,a≤x<b,,x≥b.
4.4.4 学这些概率分布有什么用
-
很多事物背后概率模型是未知的
-
对事物的运作方式、本质清楚后,若跟某概率分布的本质相同或是接近,我们便可采用该概率分布来近似、模拟该事物的运作
-
在这近似、模拟的概率模型上,便可以开始估算各式各样事件的概率。
-
视频地址在上方(有需要可以留言要云分享)
-
如有不妥,请指示正,谢谢阅读!
作者:togetlife