势函数和鞅的停时定理

问题：
对于随机过程 $\{A_0,A_1...A_t\}$ ，有 $T$ 为关于这个过程停止时间的随机变量，求 $E(T)$

势函数：一个关于状态的函数 $\phi(A)$ ，其中 $A$ 是一个状态。
对于随机过程中的任意连续两个状态 $A_t,A_{t+1}$
如果我们让 $E(\phi(A_{t+1}) - \phi(A_t)) = -1$
（注意到因为势函数和随机无关，有 $E(\phi(A)) = \phi(A)$ ，这里的形式只是为了套用停时定理，因此可以直接理解为 $\phi(A_{t+1}) + 1 = \phi(A_t)$ ）。
并且对于初始状态 $\phi(A_0)$ 为常数。
令 $X_t = A_t + t$ ，则可以得到 $E(X_t) = E(X_0) , \forall t \geq 0$
可以发现 $T$ 也是 $\{X_0,X_1,X_2...\}$ 的停时，

如果有 $E(X_T) = E(X_0)$ ，则可以得到 $E(X_T) - E(X_0) = E(\phi(A_T)+T) - E(\phi(A_0))$
从而得到 $E(T) = \phi(A_0) - \phi(A_T)$ ，也就是我们只需要初始状态和结束状态的停时即可得到停时的期望。

但是 $E(X_T)$ 不一定 $=E(X_0)$ ，实际上 $E(X_T) = E(X_0)$ 需要满足三个条件之一，这也就是停时定理的内容

从 $OI$ 做题的角度来看题目是可解的所以一定有 $E(X_T) = E(X_0)$ 。
~~当然知道一下证明也可以防止自己出题出锅被大佬喷。~~

停时定理是对于鞅成立的。
鞅：
随机过程 $\{X_0,X_1...\}$
满足 $E[X_{t+1} - X_t|X_t,X_{t-1}...X_0]=0$
（这句话的意思是在经历了 $X_0,X_1...X_t$ 的随机过程后，下一步的 $X_{t+1} - X_t$ 的期望值为 $0$ ）
可以根据这句话推出 $E(X_t) = E(X_0) , \forall t \geq 0$ ，但是不能反着推。

停时定理：
当满足下列三个条件之一时， $E(X_T) = E(X_0)$ ，其中 $T$ 是停止时间。
这三个条件按顺序是对于 $T$ 的限制逐渐变松而对于 $X$ 的限制逐渐变紧。

1. $T$ 几乎一定有界。
几乎一定的意思是概率为 $1$ ，也就是说像是在 $[0,1]$ 中随机取一个实数不等于 $x$ 的概率也为 $1$ ，但是你不能说取不到。

该情况的证明：（很伪）
$T$ 有界，则可以取 $t = T$ ，使得 $E(X_T) = E(X_t) = E(X_0)$
~~T几乎一定有界，所以该定理几乎一定成立。~~
因为 $T$ 无界的情况概率为 $0$ ，所以无法对 $E(X_T)$ 造成贡献。

至于 $T$ 什么时候才会不一定有界还几乎一定有界这就是我的知识盲区了。

扫描二维码关注公众号，回复： 11517710 查看本文章

2. $E(T)$ 有限， $|X_{t+1} - X_t|$ 一致有界或者线性增长。
有限的意思是…
算了给你们看文档吧

3. $T$ 几乎一定有限， $X_t$ 一致有界。

例题：CF 1025 G. Company Acquisitions
每个人可以有个上司，保证一个人的上司没有上司，每次随机选两个没有上司的人 $x$ , $y$ ，将 $x$ 的上司变成 $y$ ，并且对于以 $x$ 为上司的人 $v$ ， $v$ 将会变成没有上司的状态，求不能操作时的停时的期望。
（显然终止情况是有一个人没有上司，其他人的上司都是他。）

考虑到直接构造势函数是十分困难的，我们考虑用状态转移方程求出每个状态的势函数。
首先显然可以让终止状态的势函数 $=0$ ，然后我们状压转移。
。。。
。。。
等等，那不就是在状压DP吗？
是的，在大多数情况下我们的势函数完全可以看做我们的 $dp$ 状态。。。（期望 $dp$ ）
但是函数毕竟是函数，我们可以利用函数的性质进行一些变形。
比如说如果我们把每个没有上司的人和他的下属看做一个块，有 $m$ 个块，大小分别为 $a_1,a_2...a_m$
那么我们可以构造势函数为 $\phi(a) = \sum_{i=1}^m f(a_i)$ ，因为 $a_i$ 之间的顺序不重要，那么我们这下就能够减少一些不必要的信息。
~~之后的推式子就看这篇博客的第三个例题把~~

~~感觉你让我构造，那这方法还是没有啥优越感啊~~

势函数和鞅的停时定理

猜你喜欢