叶丙成-概率-chapter4-随机变量-累积分布函数CDF-概率质量函数PMF-伯努利分布-二项分布-均匀分布


视频地址1(需科学上网,有需要可以留言要云分享)
视频地址2-B站

4.1 随机变量

4.1.1 随机变量(random variable,R.V.)定义

随机变量(random variable,R.V.)定义:是一个用来把实验结果(outcome)数字化的表示方式。
存在的意义:可以让概率的推导更数学,更简明
:随机变数通常使用大写英文字母表示

4.1.2 随机变量的本质

随机变量的本质?函数
随机变量其实是一个函数,给 X X 一个outcome,就返回一个对应的数字。数学上的表示法: X : S X:S\to \Re (映射)

4.1.3 随机变量的种类

  1. 离散随机变量(Discrete R.V.)
    EX1:店员的微笑: X ( ) = 1 , X ( ) = 0 X = 0 , X = 1 X(笑)=1,X(不笑)=0\Rightarrow X=0,X=1
    EX2:小美的三个司机: X ( ) = 0 , X ( ) = 1 , X ( ) = 2 X = 0 , X = 1 , X = 2 X(明)=0,X(华)=1,X(圆)=2\Rightarrow X=0,X=1,X=2
    EX3:小明告白多少次才能成功: X ( 0 ) = 0 , X ( 1 ) = 1 , X ( 2 ) = 2 , X = 0 , X = 1 , X = 2 , X(0次)=0,X(1次)=1,X(2次)=2,\dots\Rightarrow X=0,X=1,X=2,\dots
    :离散随机变量并不代表只有有限多个case(可以是可数无穷多个)。
  2. 连续随机变量(continuous R.V)
    EX1:幸运之轮: X X 可以说 [ 0 , 1 ] [0,1] 之间的任意数字
    :连续随机变量的值是有无穷多个,而且是不可数的无穷多个。
  3. 什么是可数的,什么是不可数的?
    • 可数的:一个集合如果是可数的,这代表它包含的东西是可以一个个被数的,不管用什么方法数它里面的东西,它里面的任意一个东西,总是会被数到的。
      EX:正偶数集合 { 2 , 4 , 6 , 8 , 10 ,   } \{2, 4, 6, 8,10,\dots \} 是可数的,从中随意取一个数字,总是可以数到的。
    • 不可数的:一个集合如果是不可数的,这代表它包含的东西是无法可以一个个被数的,不管用什么方法数它里面的东西,它里面一定有一样东西是你没数到的!
      EX:0到1之间的所有数字的集合是不可数的!
    • 扩展-无穷多的世界:
      - EX1:正整数的集合和正偶数的集合相比,哪个集合里面的东西比较多?答案是一样多,正整数的集合中的值乘2即可和正偶数集合产生一一对应关系。
      - EX1:“长度为1的线段上的点”与“边长为1的正方形平面上的点”,这两个集合,哪一个点的数量比较多?答案是一样多。
      - :在无穷多的世界里面,评价两个集合相等,不能使用“你中有我,我中有你”。而是使用是否可以找到一个方法(映射),使两个无穷集合可以找到一个一一对应关系,如果有,两无穷集合是相等的。

4.1.4 随机变量的函数

阿宅若看到店员微笑,就会点200的套餐。如果店员不笑,他就点15的饮料。请问阿宅的消费金额 W W 是随机变量嘛?
解:店员表情可以由随机变量 X X 代表: X ( ) = 0 , X ( ) = 15 X(微笑)=0,X(不笑)=15
W W X X 的函数: W ( X ( ) ) = 200 W ( X ( ) ) = 15 W(X(微笑))=200,W(X(不笑))=15
所以 W W 也是喂outcome吐数字!因此, W W 也是一个随机变量!
注:随机变量的函数,也是个随机变量

4.2 累积分布函数(cumulative distribution function,CDF)

4.2.1 何谓CDF?

对任一个随机变量 X X ,我们定义其 C D F CDF
F X ( x ) = def P ( X x ) F_X(x) \overset{\text{def}}{=} P(X \leq x)
注:含等号
EX:幸运之轮
F X ( 0.5 ) = P ( x 0.5 ) = 1 2 F_X(0.5)=P(x\le 0.5)=\frac{1}{2}

4.2.2 CDF用处?

  1. 最有用的用途
    计算 X X 落在某范围内的概率
    EX1:如图计算 P ( 3 < X 5 ) P(3<X\le5) 的概率
    在这里插入图片描述
    可以将其转化为两个 C D F CDF 相减,
    P ( 3 < X 5 ) = P ( X 5 ) P ( X 3 ) P(3<X\le5)=P(X\le5)-P(X\le3)
    EX2:对比 P ( 3 < X 5 ) P(3<X\le5) P ( 3 X 5 ) P(3\le X\le5) 区别(差一个等号):
    P ( 3 X 5 ) = P ( X 5 ) P ( X 3 ) + P ( X = a ) P(3\le X\le5)=P(X\le5)-P(X\le3) + P(X=a)
  2. 离散随机变量的 C D F CDF 长什么样?(阶梯状)
    EX: X X 为骰子的点数,故 P ( X = 1 ) = P ( X = 2 ) = P ( X = 3 ) = P ( X = 4 ) = P ( X = 5 ) = P ( X = 6 ) = 1 2 P(X=1)=P(X=2)=P(X=3)=P(X=4)=P(X=5)=P(X=6)=\frac{1}{2}
    解: C D F : F X ( x ) = P ( X x ) CDF:F_X(x)=P(X\le x)
    • F X ( 0.3 ) = P ( X 0.3 ) = 0 F_X(0.3)=P(X\le 0.3)=0
    • F X ( 1 ) = P ( X 1 ) = P ( X 1.3 ) = 1 F_X(1)=P(X\le 1)=P(X\le 1.3)=1
    • F X ( 2.3 ) = P ( X 2.3 ) = P ( X 2.9 ) = 2 F_X(2.3)=P(X\le 2.3)=P(X\le 2.9)=2
      在这里插入图片描述
  3. 连续随机变量的 C D F CDF 长什么样?
    EX: X X 为幸运之轮所停下的数字, x [ 0 , 1 ) x \in [0,1) ,
    解: C D F : F X ( x ) = P ( X x ) CDF:F_X(x)=P(X\le x)
    • F X ( 0.1 ) = P ( X 0.1 ) = 0 F_X(-0.1)=P(X \le -0.1) = 0
    • F X ( 0.1 ) = P ( 0 X 0.1 ) = 0.1 F_X(0.1)=P(0 \le X \le 0.1) = 0.1
    • F X ( 0.5 ) = P ( 0 X 0.5 ) = 0.5 F_X(0.5)=P(0 \le X \le 0.5) = 0.5
    • F X ( 1 ) = P ( 0 X 1 ) = 1 F_X(1)=P(0 \le X \le 1) = 1
    • F X ( 1.7 ) = P ( 0 X 1.7 ) = 1 F_X(1.7)=P(0 \le X \le 1.7) = 1
    • P ( 0.3 < x 0.5 ) = F X ( 0.5 ) F X ( 0.3 ) = 0.5 0.3 = 0.2 P(0.3< x \le 0.5) = F_X(0.5)-F_X(0.3)=0.5-0.3=0.2
    • P ( 0.3 < x < 0.5 ) = F X ( 0. 5 ) F X ( 0.3 ) = 0.5 0.3 = 0.2 P(0.3< x < 0.5) = F_X(0.5^-)-F_X(0.3)=0.5-0.3=0.2
    • 0. 5 0.5^- 表示无限接近 0.5 0.5 的一个点

在这里插入图片描述

4.2.3 CDF的性质

  1. 离散随机变量之 C D F CDF
    F X ( x + ) = F X ( x ) F_X(x^+)=F_X(x)
    F X ( x ) = F X ( x ) P ( X = x ) F_X(x^-)=F_X(x)-P(X=x)
    注1: x + x^+ 表示比 x x 大一点,但无限接近 x x 的一个值(参考《数学分析》极限定义中的 ϵ \epsilon )
    注2: x x^- 表示比 x x 小一点,但无限接近 x x 的一个值
  2. 连续随机变量之 C D F CDF
    F X ( x + ) = F X ( x ) = F X ( x ) F_X(x^+)=F_X(x)=F_X(x^-)
  3. 共同性质
    F X ( ) = P ( x ) = 0 F_X(-\infty)=P(x\le-\infty)=0
    F X ( + ) = P ( x + ) = 1 F_X(+\infty)=P(x\le+\infty)=1
    0 F X ( x ) 1 0 \le F_X(x)\le 1

4.3 概率质量函数(probability mass function,PMF)(离散随机变量特有)

4.3.1 什么是PMF

  1. 对任一个整数值的离散随机变量 X X ,我们定义其 P M F PMF 为函数:
    p X ( x ) = def P ( X = x ) p_X(x) \overset{\text{def}}{=} P(X = x)
  2. EX: X X 为公平骰子之点数
    p X ( 3 ) = P ( X = 3 ) = 1 6 p_X(3)=P(X=3)=\frac{1}{6}

4.3.2 PMF与CDF的关系(离散随机变量通常只使用整数)

  1. F X ( 2.5 ) = P ( X 2.5 ) = P ( X = 2 ) + P ( X = 1 ) + P ( X = 0 ) + P ( X = 1 ) + = n = 2 = 2.5 P ( X = n ) F_X(2.5)=P(X\le2.5)=P(X=2)+P(X=1)+P(X=0)+P(X=-1)+\dots=\sum_{n=- \infty}^{2=|2.5|}P(X=n)
  2. 对任何 x x
    F X ( x ) = n = x P X ( n ) F_X(x)=\sum_{n=-\infty}^{|x|}P_X(n)
  • 注: x |x| 表示取整
  1. 相互转化EX1: P M F C D F PMF\to CDF
    在这里插入图片描述
    在这里插入图片描述
  2. 相互转化EX2: C D F P M F CDF \to PMF
    在这里插入图片描述
    阶梯前后的值相减
    P X ( x ) = F X ( x + x ) P_X(x) = F_X(x^+-x^-)
    在这里插入图片描述
  3. 概率分布(probability Distribution)
    任何一个 P M F PMF 或是之后介绍的 P D F PDF 都当作是一种概率分布(将总和为1的概率分布在点上)

4.4 离散概率分布(discrete probability distributions)

丢硬币:非正即反,正面概率为0.5
阿宅告白:非成功,即失败,成功概率为0.7
出门天气:非晴天即雨天,晴天概率为0.6
相似点:1次实验,两种结果。
只在意某一种结果是否发生 \Rightarrow Bernoulli概率分布

4.4.1 Bernoulli概率分布(伯努利分布)

  1. 举例
    1. PMF:若实验成功几率为0.6,做一次实验, X X 代表成功次数。记为 X B e r n o u l l i ( 0.6 ) X\sim Bernoulli(0.6)
      p X ( x ) = { 0.6 , x = 1 , 0.4 , x = 0 , 0 , o t h e r w i s e . p_X(x)=\left\{ \begin{aligned} 0.6 \quad &,x=1, \\ 0.4 \quad & ,x=0, \\ 0 \quad & ,otherwise. \end{aligned} \right.
    2. CDF: F X ( x ) = n = x p X ( x ) F_X(x)=\sum_{n=-\infty}^{|x|}p_X(x)
      F X ( x ) = { 0 , x < 0 , 0.4 , 0 x < 1 , 1 , x 1. F_X(x)=\left\{ \begin{aligned} 0 \quad &,x<0, \\ 0.4 \quad & ,0\le x<1, \\ 1 \quad & ,x \ge 1. \end{aligned} \right.
  2. 一般化
    1. PMF:若实验成功几率为 p p ,做1次实验, X X 代表成功次数。记为 X B e r n o u l l i ( p ) X\sim Bernoulli(p)
      p X ( x ) = { p , x = 1 , 1 p , x = 0 , 0 , o t h e r w i s e . p_X(x)=\left\{ \begin{aligned} p \quad &,x=1, \\ 1-p \quad & ,x=0, \\ 0 \quad & ,otherwise. \end{aligned} \right.
    2. CDF: F X ( x ) = n = x p X ( x ) F_X(x)=\sum_{n=-\infty}^{|x|}p_X(x)
      F X ( x ) = { 0 , x < 0 , 1 p , 0 x < 1 , 1 , x 1. F_X(x)=\left\{ \begin{aligned} 0 \quad &,x<0, \\ 1-p \quad & ,0\le x<1, \\ 1 \quad & ,x \ge 1. \end{aligned} \right.

4.4.2 Binomial概率分布(二项分布)

EX1:阿宅鼓起勇气搭讪10人,若每次搭讪成功几率为0.6,10次成功8次的概率为?
EX2:艺洲五天午餐在某一餐厅就餐,若每次上菜超时的概率为0.9,5天中有3天超时的概率为?
共同点:做n次实验,同一个概率,只关注n次实验出现某结果k次之概率 \Rightarrow Binomial概率分布

  1. 举例
    1. PMF:若实验成功几率为0.6,做10次实验, X X 代表成功次数。记为 X B I N ( 10 , 0.6 ) X\sim BIN(10,0.6)
      p X ( 8 ) = P ( X = 8 ) = ( 10 8 ) 0. 6 8 ( 1 0.6 ) 10 8 p_X(8)=P(X=8)=\binom{10}{8}0.6^8(1-0.6)^{10-8}
    2. CDF: F X ( x ) = n = x p X ( x ) F_X(x)=\sum_{n=-\infty}^{|x|}p_X(x)
      F X ( x ) = m = x ( 10 m ) 0. 6 m ( 1 0.6 ) n m F_X(x)=\sum_{m=-\infty}^{|x|}\binom{10}{m}0.6^m(1-0.6)^{n-m}
  2. 一般化
    1. PMF:若实验成功几率为p,做n次实验, X X 代表成功次数。记为 X B I N ( n , p ) X\sim BIN(n,p)
      p X ( x ) = P ( X = x ) = ( n x ) p x ( 1 p ) n x p_X(x)=P(X=x)=\binom{n}{x}p^x(1-p)^{n-x}
    2. CDF: F X ( x ) = n = x p X ( x ) F_X(x)=\sum_{n=-\infty}^{|x|}p_X(x)
      F X ( x ) = m = x ( n m ) p m ( 1 p ) n m F_X(x)=\sum_{m=-\infty}^{|x|}\binom{n}{m}p^m(1-p)^{n-m}

4.4.3 Uniform概率分布(均匀分布)

EX1:丢一个公平的骰子:1-6各点出现的概率均等
EX2:混哥考试,作答A,B,C,D的概率均等
EX3:狡兔三窟,出现在三个窟的概率均等
共同点:一次实验,n种结果,个结果概率均等,关注某结果是否发生 \Rightarrow Uniform概率分布

  1. 举例
    1. PMF:如果 X X 等于 3 , 4 , 5 , 6 , 7 3, 4,5,6,7 的概率均等。记为 X U N I F ( 3 , 7 ) X\sim UNIF(3,7)
      p X ( x ) = { 1 7 3 + 1 , x = 3 , 4 , 5 , 6 , 7 , 0 , o t h e r w i s e . p_X(x)=\left\{ \begin{aligned} \frac{1}{7-3+1} \quad &,x=3,4,5,6,7, \\ 0 \quad & ,otherwise. \end{aligned} \right.

    2. CDF: F X ( x ) = n = x p X ( x ) F_X(x)=\sum_{n=-\infty}^{|x|}p_X(x)

F X ( x ) = { 0 , x < 3 , x 3 + 1 6 , 3 x < 8 , 1 , x 8. F_X(x)=\left\{ \begin{aligned} 0 \quad &,x<3, \\ \frac{|x|-3+1}{6} \quad & ,3\le x<8, \\ 1 \quad & ,x \ge 8. \end{aligned} \right.

  1. 一般
    1. PMF:如果 X X 等于 a , a + 1 , , b a,a+1,\dots,b 的概率均等。记为 X U N I F ( a , b ) X\sim UNIF(a,b)
      p X ( x ) = { 1 b a + 1 , x = a , a + 1 , , b , 0 , o t h e r w i s e . p_X(x)=\left\{ \begin{aligned} \frac{1}{b-a+1} \quad &,x=a,a+1,\dots,b, \\ 0 \quad & ,otherwise. \end{aligned} \right.

    2. CDF: F X ( x ) = n = x p X ( x ) F_X(x)=\sum_{n=-\infty}^{|x|}p_X(x)

F X ( x ) = { 0 , x < a , x a + 1 b a + 1 , a x < b , 1 , x b . F_X(x)=\left\{ \begin{aligned} 0 \quad &,x<a, \\ \frac{|x|-a+1}{b-a+1} \quad & ,a\le x<b, \\ 1 \quad & ,x \ge b. \end{aligned} \right.

4.4.4 学这些概率分布有什么用

  • 很多事物背后概率模型是未知的

  • 对事物的运作方式、本质清楚后,若跟某概率分布的本质相同或是接近,我们便可采用该概率分布来近似、模拟该事物的运作

  • 在这近似、模拟的概率模型上,便可以开始估算各式各样事件的概率。

  • 视频地址在上方(有需要可以留言要云分享)

  • 如有不妥,请指示正,谢谢阅读!
    作者:togetlife

猜你喜欢

转载自blog.csdn.net/togetlife/article/details/88671767