2.3 伯努利试验和直线上的随机游动

§3 Bernoulli试验和直线上的随机游动

1.Bernoulli 概型

定义2.3.1(Bernoulli)试验

只有两种可能结果的实验被称为 Bernoulli试验。在这类问题中,我们可将事件域取为:
F = { , A , A , Ω } \mathscr{F} = \{ \empty, A,\overline{A},\Omega\}
并称出现 A A 为“成功”,出现 A \overline{A} 为“失败”。

在某些情况中,试验的结果不止两个。但是,如果我们可以认为:出现且仅仅出现某一个特定的结果时认为其“成功”,其余任何结果都视为“失败”,则此时我们也可以把问题视为 Bernoulli 试验。

在 Bernoulli 试验中,首先需要给出下面概率:
P ( A ) = p ,    P ( A ) = q P(A) = p, \ \ P(\overline{A}) = q
显然, p , q 0 p,q \geqslant 0 ,且 p + q = 1. p+q = 1.


现在,我们考虑重复进行 n n 次独立的 Bernoulli 试验。

定义2.3.2 n n 重Bernoulli试验)

在每次试验中事件 A A 和事件 A \overline{A} 出现的概率都保持不变。我们称这样的试验为 n重Bernoulli试验 ,记为 E n E^{n} .

对于 n n 重Bernoulli试验,我们有下列的四个约定:

  1. 每次试验最多出现两个可能结果之一: A A A \overline{A}
  2. A A 在每次实验中出现的概率 p p 保持不变;
  3. 各次实验相互独立;
  4. 总共进行 n n 次试验。

下面,我们给出 n n 重Bernoulli 试验的概率空间:

n n 重Bernoulli试验 E n E^{n} 的样本点形如:
( A ^ 1 , A ^ 1 , , A ^ n ) (\hat{A}_{1},\hat{A}_{1},\cdots,\hat{A}_{n})
其中, A ^ i \hat{A}_{i} A i A_{i} A i \overline{A}_{i} ,分别表示第 i i 次试验中出现 A A A \overline{A} .显见,这样的样本点总共有 2 n 2^{n} 个,这是一个有限样本空间。
为书写方便起见,我们进行如下约定:
( A 1 , A 2 , , A n 1 , A n ) (A_{1},A_{2},\cdots,A_{n-1},\overline{A}_{n})
表示前 n 1 n-1 次试验均出现事件 A A ,而第 n n 次试验出现事件 A \overline{A} ,简记为
A 1 A 2 A n 1 A n . A_{1}A_{2}\cdots A_{n-1}\overline{A}_{n}.
为给定 n n 重Bernoulli试验的样本点的概率,我们主要考察在它中 A A A \overline{A} 出现的次数。若其中有 l l A A ,从而有 n l n-l A \overline{A} ,则利用试验的独立性可知:
P ( A ^ 1 A ^ 1 A ^ n ) = P ( A ^ 1 ) P ( A ^ 2 ) P ( A ^ n ) P(\hat{A}_{1} \hat{A}_{1} \cdots \hat{A}_{n}) = P(\hat{A}_{1})P(\hat{A}_{2})\cdots P(\hat{A}_{n})
= p l q n l . =p^{l}q^{n-l}.
一般事件的概率由它所含样本点的概率求和得到。这样一来,我们已对 n n 重Bernnoulli试验给定了概率空间。

Bernoulli试验是一种重要的概率模型。它是“在相同条件下进行重复试验”的一种数学模型,尤其在讨论某事件出现的频率时常用这种模型。


2. Bernoulli概型中的一些分布

2.1 Bernoulli 分布

若我们只进行一次Bernoulli试验,则这种概率分布称为 Bernoulli分布,这是最简单的情况。


2.2 二项分布

我们记 n n 重Bernoulli试验中事件 A A 出现 k k 次的概率,记之为 b ( k ; n , p ) : b(k;n,p):

若以 B k B_{k} n n 重Bernoulli试验中事件 A A 恰好出现 k k 次这一事件,而用 A i A_{i} 表示第 i i 次试验中出现事件 A A ,以 A i \overline{A}_{i} 表示第 i i 次试验中出现 A \overline{A} ,则
B k = A 1 A 2 A k A k + 1 A n + + A 1 A 2 A n k A n k + 1 A n . B_{k} = A_{1}A_{2} \cdots A_{k} \overline{A}_{k+1} \cdots \overline{A}_{n} + \\ \cdots +\overline{A}_{1}\overline{A}_{2} \cdots \overline{A}_{n-k}A_{n-k+1} \cdots A_{n}.
右边的每一项表示在某 k k 次试验中出现事件 A A ,而在另外 n k n-k 次实验中出现 A \overline{A} ,这种项共有 ( n k ) \binom{n}{k} 个,而且两两互不相容。

显见右边各项所对应事件的概率均为 p k q n k p^{k}q^{n-k} ,我们利用概率的可加性即得:
P ( B k ) = ( n k ) p k q n k P(B_{k}) = \binom{n}{k}p^{k}q^{n-k}
即:
b ( k ; n , p ) = ( n k ) p k q n k ,   k = 0 , 1 , 2 , , n b(k;n,p) = \binom{n}{k}p^{k}q^{n-k}, \ k = 0,1,2,\cdots,n

注意到 b ( k ; n , p )   k = 0 , 1 , 2 , , n b(k;n,p), \ k = 0,1,2,\cdots,n 是二项式 ( q + p s ) n (q + ps)^{n} 展开式中 s k s^{k} 项的系数,因此上式称为 二项分布

特别地:
k = 0 n b ( k ; n , p ) = k = 0 n ( n k ) p k q n k = ( p + q ) n = 1. \sum^{n}_{k=0}b(k;n,p) = \sum_{k=0}^{n}\binom{n}{k}p^{k}q^{n-k} = (p+q)^{n} = 1.


2.3 几何分布

下面, 我们讨论在 Bernoulli 试验中"首次成功"出现在第 k k 次试验的概率. 要使"首次成功"出现在第 k k 次试验时, 必须且只需在前 k 1 k-1 次试验中均出现事件 A \overline{A} , 而在第 k k 次时出现 $A$, 因此该事件 (我们记为 W k W_{k} ) 可表示为
W k = P ( A 1 ) P ( A 2 ) P ( A k 1 ) P ( A k ) = q k 1 p . W_{k} = P(\overline{A}_{1})P(\overline{A}_{2})\cdots P(\overline{A}_{k-1})P(A_{k}) = q^{k-1}p.

g ( k ; p ) = q k 1 p ,      k = 1 , 2 , g(k;p) = q^{k-1}p,\ \ \ \ k = 1,2,\cdots
g ( k ; p ) g(k;p) 是几何级数的一般项, 故称上式为 几何分布. 此处有;
k = 1 g ( k ; p ) = k = 1 q k 1 p = p 1 1 q = 1. \sum_{k = 1}^{\infty}g(k;p) = \sum_{k = 1}^{\infty}q^{k-1}p = p \frac{1}{1-q} = 1.
几何分布给出了等待事件 A A 出现共需要试验 k k 次的概率. 这类概率在许多问题中都有涉及.


2.4 Pascal分布

下面, 我们讨论更为复杂的情况,也就是 Pascal 分布. 可以视其为几何分布的一种推广.

考虑 Bernoulli 试验,让我们考察要经过多长时间才会出现第 r r 次成功:
若第 r r 次成功发生在第 ζ \zeta 次试验,则必然有 ζ r . \zeta \geqslant r.
下面以 C k C_{k} 表示"第 r r 次成功发生在第 k k 次试验" 这一事件,并且记其概率为 f ( k ; r , p ) f(k;r,p) .

C k C_{k} 发生当且仅当前面的 k 1 k-1 次试验中有 r 1 r-1 次成功, k r k-r 次失败,而第 k k 次试验的结果为成功,这两个事件的概率分别为: ( k 1 r 1 ) p r 1 q k r \binom{k-1}{r-1}p^{r-1}q^{k-r} p p . 利用试验的独立性,得到:
P ( C k ) = ( k 1 r 1 ) p r 1 q k r p = P ( C k ) = ( k 1 r 1 ) p r q k r . P(C_{k}) = \binom{k-1}{r-1}p^{r-1}q^{k-r} \cdot p = P(C_{k}) = \binom{k-1}{r-1}p^{r}q^{k-r}.
即:
f ( k ; r , p ) = ( k 1 r 1 ) p r q k r ,     k = r , r + 1 , f(k;r,p) = \binom{k-1}{r-1}p^{r}q^{k-r}, \ \ \ k = r,r+1,\cdots
注意到:
k = r f ( k ; r , p ) = k = r ( k 1 r 1 ) p r q k r = l = 0 ( r + l 1 r 1 ) p r q l = l = 0 ( r + l 1 l ) p r q l = l = 0 ( r l ) ( 1 ) l p r q l = p r ( 1 q ) r = 1. \sum_{k = r}^{\infty}f(k;r,p) = \sum_{k =r}^{\infty}\binom{k-1}{r-1}p^{r}q^{k-r} \\ = \sum_{l = 0}^{\infty} \binom{r + l - 1}{r - 1}p^{r}q^{l} = \sum_{l = 0}^{\infty} \binom{r+l-1}{l}p^{r}q^{l} \\ = \sum_{l = 0}^{\infty}\binom{-r}{l}(-1)^{l}p^{r}q^{l} = p^{r}(1-q)^{-r} = 1.

我们称 f ( k ; r , p ) f(k;r,p) Pascal分布. 特别地,当 r = 1 r = 1 时,我们得到几何分布.


3. 直线上的随机游动

定义2.3.3 (随机游动)

我们考虑位于 x x 轴上的一个质点,并限制它只能位于整数点. 在时刻 t = 0 t = 0 时, 它处于初始位置 a    a Z a \ \ a \in \mathbb{Z} , 以后每个单位时间他总受到某个外力的随机作用使位置发生变化,分别以概率 p p 和概率 q = 1 p q = 1-p 向正方向/负方向移动一个单位.

在这个问题中, 我们所感兴趣的是质点在时刻 t = n t = n 时的位置. 我们称用这种方式描述的质点运动为 随机游动.


定义2.3.4(无限制随机游动和有吸收壁的随机游动)

若质点可在整个数轴的整数点上游动,则称这种随机游动为 无限制随机游动.

若在某点 d d 设有一个吸收壁, 质点一旦到达该点则被吸收从而不再游动, 因而游动过程结束,称这种随机游动为 d d 点有吸收壁的随机游动.

此外, 我们还可以相应地考虑带有 “反射壁” 及 “弹性壁” 的随机游动, 在一个随机游动中还可以存在不止一个壁.

p = q = 1 2 p = q = \frac{1}{2} 时,称这样的随机游动为 对称的, 此时质点向两方向移动的可能性相等.

在自然科学中, 我们可以将大量的问题都归结为随机游动问题. 例如: 随机游动模型可作为布朗运动的初步近似. 概率论中的一些古典问题也可引导到随机游动问题. 实际上, 随机游动可以视为 Bernoulli试验的一种描述法.


下面,我们简介随机游动的两个最简单的模型:

3.1 无限制随机游动

假定质点在时刻 0 0 从原点出发, 以 S n S_{n} 记它在时刻 t = n t = n 时的位置. 为了使质点在时刻 t = n t = n 时位于 k k ( k k 也可以是负整数), 质点必须而且只需在前 n n 次游动中向右游动的次数比向左游动的次数多 k k 次.

若以 x x 记它在前 n n 次游动中向右游动的次数, y y 记向左游动的次数,则
{ x + y = n x y = k \begin{cases} x + y = n \\ x - y = k\end{cases}
x = n + k 2 x = \frac{n+k}{2} , 因为 x x 是整数, 故 k k 必须和 n n 具有相同的奇偶性.

事件 { S n = k } \{S_{n} = k\} 发生相当要求在前 n n 次游动中有 n + k 2 \frac{n+k}{2} 次向右, n k 2 \frac{n-k}{2} 次向左. 利用二项分布即得:
P { S n = k } = ( n n + k 2 ) q n k 2 p n + k 2 . P\{S_{n} = k\} = \binom{n}{\frac{n+k}{2}}q^{\frac{n-k}{2}}p^{\frac{n+k}{2}}.
k k n n 奇偶性相反时, 概率为 0. 0.


3.2 两端带有吸收壁的随机游动

假定质点在时刻 t = 0 t = 0 时, 位于 x = a x = a , 而在 x = 0 x = 0 x = a + b x = a+b 处各有一个吸收壁,我们求质点在 x = 0 x = 0 被吸收或在 x = a + b x = a+b 被吸收的概率. 使用的是差分方程法:

若以 q n q_{n} 记质点的初始位置为 n n , 而最终在 a + b a+b 点被吸收的概率, 显然; q 0 = 0 ,    q a + b = 1 q_{0} = 0,\ \ q_{a+b} = 1 若某时刻质点位于 x = n x = n , 此处 1 n a + b 1 1 \leqslant n \leqslant a+b-1 , 则它要被 x = a + b x = a+b 吸收.

有两种实现方式: 第一种是接下去的一次移动是向右的, 从而最终被 x = a + b x = a+b 吸收; 另一种是接下去的一次移动是向左的, 而最终被 x = a + b x = a+b 吸收. 所以, 按照全概率公式有: q n = p q n + 1 + q q n 1 ,     n = 1 , 2 , , a + b 1. q_{n} = pq_{n+1} + qq_{n-1}, \ \ \ n = 1,2,\cdots, a+b-1. 这样, 我们就得到了关于 q n q_{n} 的一个二阶差分方程 (上式), 再利用边界条件 q 0 = 0 ,    q a + b = 1 q_{0} = 0,\ \ q_{a+b} = 1 就可以求解.
利用这个差分方程系数的特殊性, 较为方便的解法是将原差分方程改写为: p ( q n + 1 q n ) = q ( q n q n 1 ) ,     n = 1 , 2 , , a + b 1. p(q_{n+1} - q_{n}) = q(q_{n} - q_{n-1}),\ \ \ n = 1,2,\cdots,a+b-1.
下面分两种情况求解;

  1. r = 1 r=1 , 即 p = q = 1 2 p=q=\frac{1}{2} , 也即对称随机游动的场合:

此时 c n = c n 1 . c_{n} = c_{n-1}.
因此, 若记
q n + 1 q n = q n q n 1 = = q 1 q 0 = d q_{n+1}-q_{n} = q_{n}-q_{n-1} = \cdots =q_{1}-q_{0} = d

q n = q 0 + n d q_{n} = q_{0} + nd
由于 q 0 = 0 ,   q a + b = 1 q_{0} = 0, \ q_{a+b} = 1 , 故有:
q n = n a + b q_{n} = \frac{n}{a+b}
特别地:
q a = a a + b . q_{a} = \frac{a}{a+b}.


  1. r 1 r \neq 1 , 即 p q p \neq q 的场合:

此时
c n = r c n 1 = r 2 c n 2 = = r n c 0 . c_{n} = rc_{n-1} = r^{2}c_{n-2} = \cdots = r^{n}c_{0}.
从而:
q n q 0 = k = 0 n 1 ( q k + 1 q k ) = k = 0 n 1 c k = k = 0 n 1 r k c 0 = 1 r n 1 r c 0 . q_{n}-q_{0} = \sum^{n-1}_{k=0}(q_{k+1}-q_{k}) = \sum_{k=0}^{n-1}c_{k} = \sum_{k=0}^{n-1}r^{k}c_{0} = \frac{1-r^{n}}{1-r}c_{0}.
由于 q 0 = 0 ,   q a + b = 1 q_{0} = 0, \ q_{a+b} = 1 , 故有:
1 r a + b 1 r c 0 = 1 \frac{1-r^{a+b}}{1-r}c_{0} = 1
因此
q n = 1 r n 1 r a + b q_{n} = \frac{1-r^{n}}{1-r^{a+b}}
特别地:
q a = 1 r n 1 r a + b = 1 ( q p ) a 1 ( q p ) a + b . q_{a} = \frac{1-r^{n}}{1-r^{a+b}} = \frac{1-(\frac{q}{p})^{a}}{1-(\frac{q}{p})^{a+b}}.


若以 p n p_{n} 记质点从 n n 出发而在 0 0 点被吸收的概率,则同样可列出差分方程:
p n = p p n + 1 + q p n + 1 ,     n = 1 , 2 , , a + b 1. p_{n} = pp_{n+1} + qp_{n+1},\ \ \ n = 1,2,\cdots, a+b-1.
及边界条件:
p 0 = 1 ,    p a + b = 0. p_{0} = 1,\ \ p_{a+b} = 0.
类似地可以求得:当 p = q = 1 2 p = q = \frac{1}{2} 时:
p a = a a + b p_{a} = \frac{a}{a+b}
而在 p q p \neq q 的情况下:
p a = 1 ( p q ) b 1 ( p q ) a + b = ( q p ) a ( q p ) a + b 1 ( q p ) a + b . p_{a} = \frac{1-(\frac{p}{q})^{b}}{1-(\frac{p}{q})^{a+b}} = \frac{(\frac{q}{p})^{a}-(\frac{q}{p})^{a+b}}{1-(\frac{q}{p})^{a+b}}.
在任何情况下,均有:
p a + p b = 1. p_{a} + p_{b} = 1.
也就是说, 随机游动的质点最终必被两个端点之一所吸收.



4. 推广的 Bernoulli 试验与多项分布

二项分布可以被很容易地推广到 n n 次重复独立试验且每次试验可能有若干个结果的情形. 将每次试验的可能结果记为 A 1 , A 2 , , A r A_{1},A_{2},\cdots, A_{r} , 而 P ( A i ) = p i ,   i = 1 , 2 , , r , P(A_{i}) = p_{i},\ i = 1,2,\cdots,r,
p 1 + p 2 + + p r = 1 ,    p i 0. p_{1} + p_{2} + \cdots + p_{r} = 1, \ \ p_{i} \geqslant 0.
r = 2 r = 2 时, 我们即得到 Bernoulli 试验.

在这种推广的 Bernoulli 试验中,不难推出在 n n 次试验中 A i A_{i} 出现 k i k_{i} 次 ( i = 1 , 2 , , r i = 1,2,\cdots,r ) 的概率为;
n ! k 1 ! k 2 ! k r ! p 1 k 1 p 2 k 2 p r k r . \frac{n!}{k_{1}!k_{2}!\cdots k_{r}!}p_{1}^{k_{1}}p_{2}^{k_{2}}\cdots p_{r}^{k_{r}}.
此处 k i 0 k_{i} \geqslant 0 , 且 k 1 + k 2 + + k r = n . k_{1} + k_{2} + \cdots +k_{r} = n.
上式称为 多项分布, 因其为 ( p 1 + p 2 + + p r ) n (p_{1} + p_{2} + \cdots +p_{r})^{n} 展开式的一般项,且知:
k i 0     k 1 + k 2 + + k r = 1 n ! k 1 ! k 2 ! k r ! p 1 k 1 p 2 k 2 p r k r . \sum_{k_{i} \geqslant 0 \ \ \ k_{1} + k{2} + \cdots + k{r} = 1} \frac{n!}{k_{1}!k_{2}!\cdots k_{r}!}p_{1}^{k_{1}}p_{2}^{k_{2}}\cdots p_{r}^{k_{r}}.
显然,多项分布是二项分布的推广, 二项分布的许多结论均和多项分布的场合平行. 以后, 我们只详细讨论二项分布的有关问题.

发布了32 篇原创文章 · 获赞 14 · 访问量 6360

猜你喜欢

转载自blog.csdn.net/u010186354/article/details/104150877
2.3