多项分布

假设一次实验有 K 种结果，每种结果对应的概率分别为： $p_1, \ldots, p_K$ ，且满足：
$p_1 + p_2 + \cdots + p_K = 1$
则进行 M 次实验，每种结果分别出现 $m_1, \ldots, m_K$ 的概率为：
$\begin{aligned} P(m_1,\ldots,m_K; \mathbf{p}) =&C_M^{m_1} p_1^{m_1} \cdot C_{M-m_1}^{m_2} p_2^{m_2} \cdots C_{m_K}^{m_K} p_K^{m_K} \\\\ =& ( C_M^{m_1} C_{M-m_1}^{m_2} \cdots C_{m_K}^{m_K}) (p_1^{m_1} p_2^{m_2}\cdots p_K^{m_K}) \\\\ =& \frac{M!}{m_1!m_2!\ldots m_K!}p_1^{m_1} p_2^{m_2}\cdots p_K^{m_K} \end{aligned}$

狄利克雷分布

狄利克雷分布记为：
$Dir(\vec{p};\vec{\alpha}) = \frac{1}{\Delta(\vec{\alpha}) }\prod_{i=1}^Kp_i^{\alpha_i-1}$
其中 $\Delta(\vec{\alpha})$ 为归一化常数，由分布的性质，可想而知：
$\int_{\sum_{i=1}^Kp_i=1} Dir(\vec{p};\vec{\alpha}) d\vec{p} = 1$
即
$\Delta(\vec{\alpha}) = \int_{\sum_{i=1}^Kp_i=1} \prod_{i=1}^Kp_i^{\alpha_i-1} d\vec{p}$

Dirichlet-Multinomial 共轭

假设多项分布的参数 $\vec{p}$ 的先验分布为狄利克雷分布： $\vec{p} \sim Dir(\vec{p};\vec{\alpha})$

然后又做了 $\sum_{i=1}^K n_i$ 次实验(记为事件Z)，每种结果分别出现 $n_1, \ldots, n_K$ 次，求多项分布的后验概率：
$\begin{aligned} P(\vec{p} | Z) &= \frac{P(\vec{p} ,Z)}{P(Z)} \\\\ &= \frac{P(Z|\vec{p})P(\vec{p})}{\int P(Z|\vec{p})P(\vec{p}) d\vec{p}} \\\\ &= \frac{ \frac{N!}{n_1!n_2!\ldots n_K!}p_1^{n_1} p_2^{n_2}\cdots p_K^{n_K} \frac{1}{\Delta(\vec{\alpha}) }\prod_{i=1}^Kp_i^{\alpha_i-1}}{\int \frac{N!}{n_1!n_2!\ldots n_K!}p_1^{n_1} p_2^{n_2}\cdots p_K^{n_K} \frac{1}{\Delta(\vec{\alpha}) }\prod_{i=1}^Kp_i^{\alpha_i-1} d\vec{p}} \\\\ &= \frac{\prod_{i=1}^Kp_i^{n_i+\alpha_i-1}}{\int \prod_{i=1}^Kp_i^{n_i+\alpha_i-1} d\vec{p}} \\\\ &= \frac{\prod_{i=1}^Kp_i^{n_i+\alpha_i-1}}{\Delta(\vec{\alpha}+\vec{n})} \end{aligned}$
即后验分布服从新的狄利克雷分布： $Dir(\vec{p};\vec{\alpha}+\vec{n})$

Dirichlet-Multinomial 共轭

多项分布

狄利克雷分布

Dirichlet-Multinomial 共轭

猜你喜欢