借鉴了借鉴他人博客的博客
问题: 对于随机过程
{
A
0
,
A
1
.
.
.
A
t
}
\{A_0,A_1...A_t\}
{ A 0 , A 1 . . . A t } ,有
T
T
T 为关于这个过程停止时间的随机变量,求
E
(
T
)
E(T)
E ( T )
势函数:一个关于状态的函数
ϕ
(
A
)
\phi(A)
ϕ ( A ) ,其中
A
A
A 是一个状态。 对于随机过程中的任意连续两个状态
A
t
,
A
t
+
1
A_t,A_{t+1}
A t , A t + 1 如果我们让
E
(
ϕ
(
A
t
+
1
)
−
ϕ
(
A
t
)
)
=
−
1
E(\phi(A_{t+1}) - \phi(A_t)) = -1
E ( ϕ ( A t + 1 ) − ϕ ( A t ) ) = − 1 (注意到因为势函数和随机无关,有
E
(
ϕ
(
A
)
)
=
ϕ
(
A
)
E(\phi(A)) = \phi(A)
E ( ϕ ( A ) ) = ϕ ( A ) ,这里的形式只是为了套用停时定理,因此可以直接理解为
ϕ
(
A
t
+
1
)
+
1
=
ϕ
(
A
t
)
\phi(A_{t+1}) + 1 = \phi(A_t)
ϕ ( A t + 1 ) + 1 = ϕ ( A t ) )。 并且对于初始状态
ϕ
(
A
0
)
\phi(A_0)
ϕ ( A 0 ) 为常数。 令
X
t
=
A
t
+
t
X_t = A_t + t
X t = A t + t ,则可以得到
E
(
X
t
)
=
E
(
X
0
)
,
∀
t
≥
0
E(X_t) = E(X_0) , \forall t \geq 0
E ( X t ) = E ( X 0 ) , ∀ t ≥ 0 可以发现
T
T
T 也是
{
X
0
,
X
1
,
X
2
.
.
.
}
\{X_0,X_1,X_2...\}
{ X 0 , X 1 , X 2 . . . } 的停时,
如果有
E
(
X
T
)
=
E
(
X
0
)
E(X_T) = E(X_0)
E ( X T ) = E ( X 0 ) ,则可以得到
E
(
X
T
)
−
E
(
X
0
)
=
E
(
ϕ
(
A
T
)
+
T
)
−
E
(
ϕ
(
A
0
)
)
E(X_T) - E(X_0) = E(\phi(A_T)+T) - E(\phi(A_0))
E ( X T ) − E ( X 0 ) = E ( ϕ ( A T ) + T ) − E ( ϕ ( A 0 ) ) 从而得到
E
(
T
)
=
ϕ
(
A
0
)
−
ϕ
(
A
T
)
E(T) = \phi(A_0) - \phi(A_T)
E ( T ) = ϕ ( A 0 ) − ϕ ( A T ) ,也就是我们只需要初始状态和结束状态的停时即可得到停时的期望。
但是
E
(
X
T
)
E(X_T)
E ( X T ) 不一定
=
E
(
X
0
)
=E(X_0)
= E ( X 0 ) ,实际上
E
(
X
T
)
=
E
(
X
0
)
E(X_T) = E(X_0)
E ( X T ) = E ( X 0 ) 需要满足三个条件之一,这也就是停时定理的内容
从
O
I
OI
O I 做题的角度来看题目是可解的所以一定有
E
(
X
T
)
=
E
(
X
0
)
E(X_T) = E(X_0)
E ( X T ) = E ( X 0 ) 。 当然知道一下证明也可以防止自己出题出锅被大佬喷。
停时定理是对于鞅成立的。 鞅: 随机过程
{
X
0
,
X
1
.
.
.
}
\{X_0,X_1...\}
{ X 0 , X 1 . . . } 满足
E
[
X
t
+
1
−
X
t
∣
X
t
,
X
t
−
1
.
.
.
X
0
]
=
0
E[X_{t+1} - X_t|X_t,X_{t-1}...X_0]=0
E [ X t + 1 − X t ∣ X t , X t − 1 . . . X 0 ] = 0 (这句话的意思是在经历了
X
0
,
X
1
.
.
.
X
t
X_0,X_1...X_t
X 0 , X 1 . . . X t 的随机过程后,下一步的
X
t
+
1
−
X
t
X_{t+1} - X_t
X t + 1 − X t 的期望值为
0
0
0 ) 可以根据这句话推出
E
(
X
t
)
=
E
(
X
0
)
,
∀
t
≥
0
E(X_t) = E(X_0) , \forall t \geq 0
E ( X t ) = E ( X 0 ) , ∀ t ≥ 0 ,但是不能反着推。
停时定理: 当满足下列三个条件之一时,
E
(
X
T
)
=
E
(
X
0
)
E(X_T) = E(X_0)
E ( X T ) = E ( X 0 ) ,其中
T
T
T 是停止时间。 这三个条件按顺序是对于
T
T
T 的限制逐渐变松而对于
X
X
X 的限制逐渐变紧。
1.
T
T
T 几乎一定有界。 几乎一定的意思是概率为
1
1
1 ,也就是说像是在
[
0
,
1
]
[0,1]
[ 0 , 1 ] 中随机取一个实数不等于
x
x
x 的概率也为
1
1
1 ,但是你不能说取不到。
该情况的证明:(很伪 )
T
T
T 有界,则可以取
t
=
T
t = T
t = T ,使得
E
(
X
T
)
=
E
(
X
t
)
=
E
(
X
0
)
E(X_T) = E(X_t) = E(X_0)
E ( X T ) = E ( X t ) = E ( X 0 ) T几乎一定有界,所以该定理几乎一定成立。 因为
T
T
T 无界的情况概率为
0
0
0 ,所以无法对
E
(
X
T
)
E(X_T)
E ( X T ) 造成贡献。
至于
T
T
T 什么时候才会不一定有界还几乎一定有界这就是我的知识盲区了。
扫描二维码关注公众号,回复:
11517710 查看本文章
2.
E
(
T
)
E(T)
E ( T ) 有限,
∣
X
t
+
1
−
X
t
∣
|X_{t+1} - X_t|
∣ X t + 1 − X t ∣ 一致有界或者线性增长。 有限的意思是… 算了给你们看文档 吧
3.
T
T
T 几乎一定有限,
X
t
X_t
X t 一致有界。
例题:CF 1025 G. Company Acquisitions 每个人可以有个上司,保证一个人的上司没有上司,每次随机选两个没有上司的人
x
x
x ,
y
y
y ,将
x
x
x 的上司变成
y
y
y ,并且对于以
x
x
x 为上司的人
v
v
v ,
v
v
v 将会变成没有上司的状态,求不能操作时的停时的期望。 (显然终止情况是有一个人没有上司,其他人的上司都是他。)
考虑到直接构造势函数是十分困难的,我们考虑用状态转移方程求出每个状态的势函数。 首先显然可以让终止状态的势函数
=
0
=0
= 0 ,然后我们状压转移。 。。。 。。。 等等,那不就是在状压DP吗? 是的,在大多数情况下我们的势函数完全可以看做我们的
d
p
dp
d p 状态。。。(期望
d
p
dp
d p ) 但是函数毕竟是函数,我们可以利用函数的性质进行一些变形。 比如说如果我们把每个没有上司的人和他的下属看做一个块,有
m
m
m 个块,大小分别为
a
1
,
a
2
.
.
.
a
m
a_1,a_2...a_m
a 1 , a 2 . . . a m 那么我们可以构造势函数为
ϕ
(
a
)
=
∑
i
=
1
m
f
(
a
i
)
\phi(a) = \sum_{i=1}^m f(a_i)
ϕ ( a ) = ∑ i = 1 m f ( a i ) ,因为
a
i
a_i
a i 之间的顺序不重要,那么我们这下就能够减少一些不必要的信息。 之后的推式子就看这篇博客的第三个例题把
感觉你让我构造,那这方法还是没有啥优越感啊