叶丙成-概率-chapter4-随机变量-累积分布函数CDF-概率质量函数PMF-伯努利分布-二项分布-均匀分布 - 代码天地

叶丙成-概率-chapter4-随机变量-累积分布函数CDF-概率质量函数PMF-伯努利分布-二项分布-均匀分布

其他 2019-03-22 13:50:50 阅读次数: 0

国立台湾大学叶丙成《机率》课程学习-chapter4-随机变量-累积分布函数CDF-概率质量函数PMF-伯努利分布-二项分布-均匀分布

4.1 随机变量

4.1.1 随机变量(random variable,R.V.)定义
4.1.2 随机变量的本质
4.1.3 随机变量的种类
4.1.4 随机变量的函数

4.2 累积分布函数(cumulative distribution function,CDF)

4.2.1 何谓CDF？
4.2.2 CDF用处？
4.2.3 CDF的性质

4.3 概率质量函数(probability mass function,PMF)(离散随机变量特有)

4.3.1 什么是PMF
4.3.2 PMF与CDF的关系(离散随机变量通常只使用整数)

4.4 离散概率分布(discrete probability distributions)

4.4.1 Bernoulli概率分布(伯努利分布)
4.4.2 Binomial概率分布(二项分布)
4.4.3 Uniform概率分布(均匀分布)
4.4.4 学这些概率分布有什么用

视频地址1(需科学上网，有需要可以留言要云分享)
视频地址2-B站

4.1 随机变量

4.1.1 随机变量(random variable,R.V.)定义

随机变量(random variable,R.V.)定义：是一个用来把实验结果(outcome)数字化的表示方式。
存在的意义：可以让概率的推导更数学，更简明
注：随机变数通常使用大写英文字母表示

4.1.2 随机变量的本质

随机变量的本质？函数！
随机变量其实是一个函数，给 $X$ 一个outcome，就返回一个对应的数字。数学上的表示法： $X:S\to \Re$ (映射)

4.1.3 随机变量的种类

离散随机变量(Discrete R.V.)
EX1:店员的微笑： $X(笑)=1,X(不笑)=0\Rightarrow X=0,X=1$
EX2:小美的三个司机： $X(明)=0,X(华)=1,X(圆)=2\Rightarrow X=0,X=1,X=2$
EX3:小明告白多少次才能成功： $X(0次)=0,X(1次)=1,X(2次)=2,\dots\Rightarrow X=0,X=1,X=2,\dots$
注：离散随机变量并不代表只有有限多个case(可以是可数无穷多个)。
连续随机变量(continuous R.V)
EX1:幸运之轮： $X$ 可以说 $[0,1]$ 之间的任意数字
注：连续随机变量的值是有无穷多个，而且是不可数的无穷多个。
什么是可数的，什么是不可数的？
- 可数的：一个集合如果是可数的，这代表它包含的东西是可以一个个被数的，不管用什么方法数它里面的东西，它里面的任意一个东西，总是会被数到的。
  EX:正偶数集合 $\{2, 4, 6, 8,10,\dots \}$ 是可数的，从中随意取一个数字，总是可以数到的。
- 不可数的：一个集合如果是不可数的，这代表它包含的东西是无法可以一个个被数的，不管用什么方法数它里面的东西，它里面一定有一样东西是你没数到的！
  EX：0到1之间的所有数字的集合是不可数的！
- 扩展-无穷多的世界：
  - EX1:正整数的集合和正偶数的集合相比，哪个集合里面的东西比较多？答案是一样多，正整数的集合中的值乘2即可和正偶数集合产生一一对应关系。
  - EX1:“长度为1的线段上的点”与“边长为1的正方形平面上的点”，这两个集合，哪一个点的数量比较多？答案是一样多。
  - 注：在无穷多的世界里面，评价两个集合相等，不能使用“你中有我，我中有你”。而是使用是否可以找到一个方法(映射)，使两个无穷集合可以找到一个一一对应关系，如果有，两无穷集合是相等的。

4.1.4 随机变量的函数

阿宅若看到店员微笑，就会点200的套餐。如果店员不笑，他就点15的饮料。请问阿宅的消费金额 $W$ 是随机变量嘛？
解：店员表情可以由随机变量 $X$ 代表： $X(微笑)=0,X(不笑)=15$
$W$ 是 $X$ 的函数： $W(X(微笑))=200，W(X(不笑))=15$
所以 $W$ 也是喂outcome吐数字！因此， $W$ 也是一个随机变量！
注：随机变量的函数，也是个随机变量

4.2 累积分布函数(cumulative distribution function,CDF)

4.2.1 何谓CDF？

对任一个随机变量 $X$ ，我们定义其 $CDF$ 为
$F_X(x) \overset{\text{def}}{=} P(X \leq x)$
注：含等号
EX:幸运之轮
$F_X(0.5)=P(x\le 0.5)=\frac{1}{2}$

4.2.2 CDF用处？

最有用的用途
计算 $X$ 落在某范围内的概率
EX1:如图计算 $P(3<X\le5)$ 的概率

可以将其转化为两个 $CDF$ 相减，
$P(3<X\le5)=P(X\le5)-P(X\le3)$
EX2:对比 $P(3<X\le5)$ 与 $P(3\le X\le5)$ 区别(差一个等号):
$P(3\le X\le5)=P(X\le5)-P(X\le3) + P(X=a)$
离散随机变量的 $CDF$ 长什么样？(阶梯状)
EX: $X$ 为骰子的点数，故 $P(X=1)=P(X=2)=P(X=3)=P(X=4)=P(X=5)=P(X=6)=\frac{1}{2}$
解： $CDF:F_X(x)=P(X\le x)$
- $F_X(0.3)=P(X\le 0.3)=0$
- $F_X(1)=P(X\le 1)=P(X\le 1.3)=1$
- $F_X(2.3)=P(X\le 2.3)=P(X\le 2.9)=2$
连续随机变量的 $CDF$ 长什么样？
EX: $X$ 为幸运之轮所停下的数字， $x \in [0,1)$ ,
解： $CDF:F_X(x)=P(X\le x)$
- $F_X(-0.1)=P(X \le -0.1) = 0$
- $F_X(0.1)=P(0 \le X \le 0.1) = 0.1$
- $F_X(0.5)=P(0 \le X \le 0.5) = 0.5$
- $F_X(1)=P(0 \le X \le 1) = 1$
- $F_X(1.7)=P(0 \le X \le 1.7) = 1$
- $P(0.3< x \le 0.5) = F_X(0.5)-F_X(0.3)=0.5-0.3=0.2$
- $P(0.3< x < 0.5) = F_X(0.5^-)-F_X(0.3)=0.5-0.3=0.2$
- 注： $0.5^-$ 表示无限接近 $0.5$ 的一个点

在这里插入图片描述

4.2.3 CDF的性质

离散随机变量之 $CDF$
$F_X(x^+)=F_X(x)$
$F_X(x^-)=F_X(x)-P(X=x)$
注1： $x^+$ 表示比 $x$ 大一点，但无限接近 $x$ 的一个值(参考《数学分析》极限定义中的 $\epsilon$ )
注2： $x^-$ 表示比 $x$ 小一点，但无限接近 $x$ 的一个值
连续随机变量之 $CDF$
$F_X(x^+)=F_X(x)=F_X(x^-)$
共同性质
$F_X(-\infty)=P(x\le-\infty)=0$
$F_X(+\infty)=P(x\le+\infty)=1$
$0 \le F_X(x)\le 1$

4.3 概率质量函数(probability mass function,PMF)(离散随机变量特有)

4.3.1 什么是PMF

对任一个整数值的离散随机变量 $X$ ，我们定义其 $PMF$ 为函数：
$p_X(x) \overset{\text{def}}{=} P(X = x)$
EX: $X$ 为公平骰子之点数
$p_X(3)=P(X=3)=\frac{1}{6}$

4.3.2 PMF与CDF的关系(离散随机变量通常只使用整数)

$F_X(2.5)=P(X\le2.5)=P(X=2)+P(X=1)+P(X=0)+P(X=-1)+\dots=\sum_{n=- \infty}^{2=|2.5|}P(X=n)$
对任何 $x$
$F_X(x)=\sum_{n=-\infty}^{|x|}P_X(n)$

注： $|x|$ 表示取整

相互转化EX1： $PMF\to CDF$
相互转化EX2： $CDF \to PMF$

阶梯前后的值相减
$P_X(x) = F_X(x^+-x^-)$
概率分布(probability Distribution)
任何一个 $PMF$ 或是之后介绍的 $PDF$ 都当作是一种概率分布(将总和为1的概率分布在点上)

4.4 离散概率分布(discrete probability distributions)

丢硬币：非正即反，正面概率为0.5
阿宅告白：非成功，即失败，成功概率为0.7
出门天气：非晴天即雨天，晴天概率为0.6
相似点：1次实验，两种结果。
只在意某一种结果是否发生 $\Rightarrow$ Bernoulli概率分布

4.4.1 Bernoulli概率分布(伯努利分布)

举例
1. PMF:若实验成功几率为0.6，做一次实验， $X$ 代表成功次数。记为 $X\sim Bernoulli(0.6)$
  $p_X(x)=\left\{ \begin{aligned} 0.6 \quad &,x=1, \\ 0.4 \quad & ,x=0, \\ 0 \quad & ,otherwise. \end{aligned} \right.$
2. CDF: $F_X(x)=\sum_{n=-\infty}^{|x|}p_X(x)$
  $F_X(x)=\left\{ \begin{aligned} 0 \quad &,x<0, \\ 0.4 \quad & ,0\le x<1, \\ 1 \quad & ,x \ge 1. \end{aligned} \right.$
一般化
1. PMF:若实验成功几率为 $p$ ，做1次实验， $X$ 代表成功次数。记为 $X\sim Bernoulli(p)$
  $p_X(x)=\left\{ \begin{aligned} p \quad &,x=1, \\ 1-p \quad & ,x=0, \\ 0 \quad & ,otherwise. \end{aligned} \right.$
2. CDF: $F_X(x)=\sum_{n=-\infty}^{|x|}p_X(x)$
  $F_X(x)=\left\{ \begin{aligned} 0 \quad &,x<0, \\ 1-p \quad & ,0\le x<1, \\ 1 \quad & ,x \ge 1. \end{aligned} \right.$

4.4.2 Binomial概率分布(二项分布)

EX1:阿宅鼓起勇气搭讪10人，若每次搭讪成功几率为0.6,10次成功8次的概率为？
EX2:艺洲五天午餐在某一餐厅就餐，若每次上菜超时的概率为0.9，5天中有3天超时的概率为？
共同点：做n次实验，同一个概率，只关注n次实验出现某结果k次之概率 $\Rightarrow$ Binomial概率分布

举例
1. PMF:若实验成功几率为0.6，做10次实验， $X$ 代表成功次数。记为 $X\sim BIN(10,0.6)$
  $p_X(8)=P(X=8)=\binom{10}{8}0.6^8(1-0.6)^{10-8}$
2. CDF: $F_X(x)=\sum_{n=-\infty}^{|x|}p_X(x)$
  $F_X(x)=\sum_{m=-\infty}^{|x|}\binom{10}{m}0.6^m(1-0.6)^{n-m}$
一般化
1. PMF:若实验成功几率为p，做n次实验， $X$ 代表成功次数。记为 $X\sim BIN(n,p)$
  $p_X(x)=P(X=x)=\binom{n}{x}p^x(1-p)^{n-x}$
2. CDF: $F_X(x)=\sum_{n=-\infty}^{|x|}p_X(x)$
  $F_X(x)=\sum_{m=-\infty}^{|x|}\binom{n}{m}p^m(1-p)^{n-m}$

4.4.3 Uniform概率分布(均匀分布)

EX1:丢一个公平的骰子：1-6各点出现的概率均等
EX2:混哥考试，作答A，B，C，D的概率均等
EX3:狡兔三窟，出现在三个窟的概率均等
共同点：一次实验，n种结果，个结果概率均等，关注某结果是否发生 $\Rightarrow$ Uniform概率分布

举例
1. PMF:如果 $X$ 等于 $3, 4,5,6,7$ 的概率均等。记为 $X\sim UNIF(3,7)$
  $p_X(x)=\left\{ \begin{aligned} \frac{1}{7-3+1} \quad &,x=3,4,5,6,7, \\ 0 \quad & ,otherwise. \end{aligned} \right.$
2. CDF: $F_X(x)=\sum_{n=-\infty}^{|x|}p_X(x)$

$F_X(x)=\left\{ \begin{aligned} 0 \quad &,x<3, \\ \frac{|x|-3+1}{6} \quad & ,3\le x<8, \\ 1 \quad & ,x \ge 8. \end{aligned} \right.$

一般
1. PMF:如果 $X$ 等于 $a,a+1,\dots,b$ 的概率均等。记为 $X\sim UNIF(a,b)$
  $p_X(x)=\left\{ \begin{aligned} \frac{1}{b-a+1} \quad &,x=a,a+1,\dots,b, \\ 0 \quad & ,otherwise. \end{aligned} \right.$
2. CDF: $F_X(x)=\sum_{n=-\infty}^{|x|}p_X(x)$

$F_X(x)=\left\{ \begin{aligned} 0 \quad &,x<a, \\ \frac{|x|-a+1}{b-a+1} \quad & ,a\le x<b, \\ 1 \quad & ,x \ge b. \end{aligned} \right.$

4.4.4 学这些概率分布有什么用

很多事物背后概率模型是未知的
对事物的运作方式、本质清楚后，若跟某概率分布的本质相同或是接近，我们便可采用该概率分布来近似、模拟该事物的运作
在这近似、模拟的概率模型上，便可以开始估算各式各样事件的概率。
视频地址在上方(有需要可以留言要云分享)
如有不妥，请指示正，谢谢阅读！
作者：togetlife

猜你喜欢

转载自blog.csdn.net/togetlife/article/details/88671767

今日推荐

周排行

Leetcode简单题61~80

解决zookeeper磁盘IO高的问题

多线程相关方法详解

Maven-setting.xml文件详解

Maven 项目的 classpath 理解

渊亭科技大数据笔试题

配置JVM内存分配

计算机网络个人学习笔记（三）网络层：第三部分连载

js中两个等号(==)和三个等号(===)的区别

用C程序自动打开电脑上的程序

每日归档

更多

2024-09-18(0)

2024-09-17(0)

2024-09-16(0)

2024-09-15(0)

2024-09-14(0)

2024-09-13(0)

2024-09-12(0)

2024-09-11(0)

2024-09-10(0)

2024-09-09(0)