EM 算法未知分布 Qi 的推导过程

EM 算法引入未知分布 $Q_i(z^{(i)})$ 后， Jensen 不等式等号成立的条件是变量 X 为常量，据此得到一个等式：

$\frac{P(x^i,z^i；\theta)}{Q_i(z^{(i)})}=c，c为常数$

如何根据这个等式推导出 $Q_i(z^{(i)})$ 是一个关于隐数据 $z^i$ 的条件概率的呢？下面就是整个推导过程。

（1）已知： $\frac{P(x^i,z^i；\theta)}{Q_i(z^{(i)})}=c，c为常数$
（2）所以： $P(x^i,z^i；\theta)=c*Q_i(z^{(i)})$
（3）已知： $Q_i(z^{(i)})$ 是一个概率分布
（4）所以： $\sum\limits_{z}Q_i(z^{(i)})=1$ ，概率总和为 1
（5）对（2）式两边分别求和得到

$\sum\limits_{z}P(x^i,z^i；\theta)=\sum\limits_{z}c*Q_i(z^{(i)})=c*[\sum\limits_{z}*Q_i(z^{(i)}]=c，c 是常数$

即： $\sum\limits_{z}P(x^i,z^i；\theta)=c$
（6）根据（1）进行转换，将 c 替换为（5），得到： $Q_i(z^{(i)})=\frac{P(x^i,z^i；\theta)}{\sum\limits_{z}P(x^i,z^i；\theta)}$
（7）已知样本 $x^i$ 和它对应的隐状态 $z^i$ ，根据全概率公式有： $P(x^i;\theta)=\sum\limits_{z}P(x^i,z^i；\theta)$
（8）将（6）的分母换成（7），就得到未知分布是关于隐数据 $z^j$ 的条件概率

$Q_i(z^{(i)})=\frac{P(x^i,z^i；\theta)}{\sum\limits_{z}P(x^i,z^i；\theta)}=\frac{P(x^i,z^i；\theta)}{P(x^i;\theta)}=P(z^i|x^i;\theta)$

搞清楚推导过程后，我们来看看 EM 算法的基本过程：

初始化分布参数 $\theta$
E 步：用第一步的初始化参数 $\theta$ 计算 $Q_i$ ,它的本质是一个条件概率，即对于当前样本 $X_i$ ,它由第 k 个组件生成的概率，即 $P(Z_i=k|X_i)=\frac{P(Z_i=k)*P(X_i|Z_i=k)}{P(X_i)}$ 。
M 步：将 $Q_i$ 带入最大似然函数中，得到关于参数的表达式，求使得该表达式达到最大的 $\theta$ 的值，作为下一轮迭代的初始值。
重复 2、3 步，直到收敛。

毕小宝博客专家

发布了234 篇原创文章 · 获赞 494 · 访问量 37万+

他的留言板关注

EM 算法未知分布 Qi 的推导过程

猜你喜欢