前言
本文介绍了什么是隐马尔科夫模型及其基本概念。学习资料来自李航《统计学习方法》和网络博客。通过举例加深对模型的理解,阅读本文可以完全掌握隐马的基本原理和符号表示。
什么是隐马尔科夫
隐马尔科夫模型由初始概率分布、状态转移概率分布以及观测概率分布确定。隐马尔科夫模型
λ 可以用三元符号表示:其中λ=(A,B,π) A,B,λ 被称为隐马尔科夫模型的三要素。
此外,我们还有一些常见名词:
所有可能状态集合Q:Q={q1,q2,...,qN}
所有可能观测集合V:长度为T的状态序列I:V={v1,v2,...,vN} I=(i1,i2,...,iT)
与之对应的观测序列O:状态转移概率矩阵:O=(o1,o2,...,oT) 其中A=[aij]N∗N 是在t时刻处于状态aij=P(it+1=qj|it=qi) qj 的条件下在时刻t+1转移到状态qj 的概率。
观测概率矩阵B:其中B=[bj(k)]N∗M 是在t时刻处于状态bj(k)=P(ot=vk|it=qk) qj 的条件下生成观测vk 的概率。
模型举例
假设有4个盒子,编号为A、B、C、D。每个盒子里面都装有红白两种颜色的球。
盒子 | A | B | C | D |
---|---|---|---|---|
红球数 | 5 | 3 | 6 | 8 |
白球数 | 5 | 7 | 4 | 2 |
按照一定的方法抽球:从4个盒子里面以等概论随机选取一个盒子,从这个盒子里面随机抽取1个求,记录颜色后放回。然后再重新选取盒子,进行下一轮的抽取。每轮抽取的规则如下:
如果当前选取A盒子,那么下次必须选取B盒子;
如果当前选取B盒子,那么下次有0.4概率选取A盒子,0.6 概率选取C盒子;
如果当前选取C盒子,那么下次有0.4概率选取B盒子,0.6概率选取D盒子;
如果当前是D盒子,那么下次有0.5概率选取D盒子,0.5概率选取C盒子。
某次实验中,我们按照某种次序,依次从五个盒子里共抽取了,得到球的颜色顺序如下:{红,红,白,白,红}
(设计如此“复杂”的规则是为了后面清晰地表明矩阵的含义)
模型与例子的变量对应说明
“盒子”对应状态。本实验中,状态集合为:
“每个盒子里各自的红白球数”对应 观测概率分布:
两个基本假设
- 齐次马尔科夫性假设:假设隐藏的马尔科夫链在任意t时刻的状态只依赖于前一时刻的状态,与其他时刻的状态及观测无关。本实验中,抽取下个盒子X的概率只跟抽取前一个盒子X有关,与其他时刻抽取盒子和抽取的球颜色没有关系。
- 观测独立性假设:假设任意时刻的观测只依赖于该时刻的马尔科夫链的状态,与其他观测及状态无关。在本实验中,抽取红球和白球的概率只与当前抽取的盒子有关,与其他抽取球的颜色和抽取的盒子无关。
后续
隐马尔科夫模型是关于时序的概率模型,描述由一个隐藏的马尔科夫链随机生成不可观测的状态序列,再由各个状态随机生成一个观测而产生观测序列的过程
如果你认真阅读了例子和对应关系,我相信能够比较清楚地理解什么是隐马尔科夫模型了。本人水平有限,如有任何表达不清或错误地方,欢迎各位朋友交流指正。