自动机相关

自动机
自动机类型：有限自动机(finite automata,FA)，下推自动机(push-down automata, PDA)，线性界限自动机(linear-bounded automata)和图灵机(Turing machine)

有限自动机
确定性有限自动机
DFA(deterministic automata) M 是一个五元组

M=(Σ,Q,δ,q0,F)
其中，Σ是输入符号的有穷集合，Q 是状态的有限集合，q0∈Q是初始状态，F 是终止状态集合，F⊆Q，δ 是 Q×Σ 到 Q（下一个状态）的映射，也称状态转移函数。

注：Q×Σ表示两个集合的直积，这里表示分别从两个集合中取任意元素的组成的有序对，生成有序对的集合。

DFA M 接受的语言，记作T(M):

T(M)={x|δ(q0,x)∈F}
其中，x 表示一个句子，且 x∈Σ∗，我们扩展转移函数为，

δ^:Q×Σ∗→Q
δ^(q,ϵ)=q
δ^(q,xa)=δ(δ(q,a),x)
其中x′→xa为右线性正则文法产生式（应用到句子上的情况）

不确定性有限自动机
NFA(non-definite automata) M 是一个五元组

M=(Σ,Q,δ,q0,F)
其中，Σ是输入符号的有穷集合，Q 是状态的有限集合，q0∈Q是初始状态，F 是终止状态集合，δ是直积Q×Σ 到 Q的幂集的映射。集合的幂集是集合所有的子集（包括空集和自身）组成的集合，这个集合的元素个数为2|Q|=∑|Q|i=0(|Q|i)
NFA与DFA不同的是，DFA 的δ(q,a)是一个确定的状态作为下一个状态，而NFA的δ(q,a)是一个集合，其中任一状态都有可能作为下一状态，

δ:Q×Σ→P(Q)
我们扩展转移函数如下，

δ^:Q×Σ∗→P(Q)
δ^(q,ϵ)=s
δ^{(q,xa)=⋃r∈δ(q,a)δ}(r,x)
NFA M 接受的语言为，

T(M)={x|p∈δ(q0,x),p∈F
其中，x 表示一个句子

正则文法与FA

定理：若G=(VN,VT,P,S)表示一个正则文法，则存在一个FAM=(Σ,Q,δ,q0,F)，使得T(M)=L(G)
其中，VN表示非终结符，VT表示终结符

于是可以由给定正则文法构造FA M，步骤如下：

令Σ=VT,Q=VN∪T,q0=S，其中 T 是新增的一个非终结符
如果P中存在产生式S→ϵ，则 F={S,T}，否则F={T}
如果P中存在产生式B→a,B∈VN,a∈VT，则T∈δ(B,a)
如果P中存在产生式B→aC,B,C∈VN,a∈VT，则C∈δ(B,a)
对于每个a∈VT，有δ(T,a)=∅
上面这个步骤给出的太突然，初看可能会不太容易理解。

我们从给出的正则文法出发，根据上篇文章的介绍，正则文法的规则是（为了与上面步骤相一致，以右线性正则文法为例）A→x|xB，可见非终结符总是由一种或多种终结符的方幂连接而成，也就是说，非终结符是有终结符组成，所以正则文法所识别的句子最终都是由终结符组成，所以步骤（1）中，FA M的输入符号集就是Σ=VT，FA M的上个状态在某一输入符的条件下转换到下一状态，而这个输入符正是文法中的终结符x，正好对应文法规则的产生式A→xB，不难想到，这对应着FA M中状态转变，即状态 A 转换到状态 B，而A 和 B 是文法中的非终结符，所以FA M的状态集合Q=VN。不过，这样就OK了吗？显然没有，此时Q中的状态全部是VN中的非终结符，根据文法产生式，非终结符总是要继续推导下去的，这说明，Q中少了能表示终止的状态，否则就是要构造无限长度的句子了。我们新增一个非终结符T，这个非终结符T很特殊，它没有产生式，它的具体意义稍后就会解释。不过我们的Q 就完整了，于是Q=VN∪T。另外，FA M的起始状态则不难理解为是文法的起始符q0=S。

接着看步骤3、4和5

右线性正则文法的产生式有：B→a,B∈VN,a∈VT，表示一个非空终止符B 产生出一个终止符a，这个产生式的右端没有非终结符，根据这种产生式，对应于FA M则是由状态B 接收一个输入符a 后进入下一个状态，这个状态就是前面新引入的那个T，即，但凡应用了B→a这种右端没有非终结符的产生式，FA M就进入下一个状态T，由状态B并接收一个输入符a进入下一个状态T，如果是NFA，则是下一个状态集合，这里为了不失一般性，我们考虑NFA（毕竟DFA是NFA的特例），即δ(B,a)是下一个状态集合，那么如果经过产生式B→a变换后，，FA M进入状态T，则 T∈δ(B,a)。

根据右线性正则文法，如果有产生式：B→aC,B,C∈VN,a∈VT，那么根据上面的阐述，应该知道应用了此产生式后，FA M进入下一个状态C，且C∈δ(B,a)。当然如果还有产生式B→aD，那么D∈δ(B,a)；如果B 只有一个产生式B→a，那么δ(B,a)只有一个元素，δ(B,a)={T}
前面提到过，新引入的非终结符T没有产生式，没有T→a|aA这样的产生式，所以δ(T,a)=∅
然后来看步骤2，

FA M的终止状态集合F⊆Q，显然集合Q里面只有状态T 可以作为终止状态，即应用了文法产生式B→a之后进入状态T，所以F={T}。前面我们介绍文法时，没有引入ϵ，现在将其引入，这样就可以产生“空句子”，如果S→ϵ，即产生一个空句子，那么显然，使用起始状态 S 作为此时的终止状态，所以，如果有产生式S→ϵ，此时F={S,T}，而 S∈VN，此时依然能保证F⊆Q，当然如果没有产生式S→ϵ，那么F={T}，即只有非空句子的终止状态T

定理：若M=(Σ,Q,δ,q0,F)是一个有限自动机，则存在一个正则文法G=(VN,VT,P,S)，使得L(G)=T(M)
由FA M构造G的步骤：

令VN=Q，VT=Σ，S=q0。根据前面的说明，这里应该不难理解
如果C∈δ(B,a),B,C∈Q,a∈Σ，则在P中存在产生式：B→aC。根据前面的说明，反过来就得到这条步骤
如果C∈δ(B,a),C∈F，则P中存在产生式B→a。根据前面的说明，这里C 就是T

上下文无关文法与下推自动机

下推自动机(Pushdown Automata, PDA)用于实现上下文无关文法(CFG)。PDA 可以表达成一个七元组：

M=(Σ,Q,Γ,δ,q0,Z0,F)
Q: 状态的有限集合

Σ: 输入符号集

Γ: 栈符号表

δ: 转移函数

q0: 初始状态

Z0: 初始栈顶符号（也有叫栈底符号的，因为初始时栈里仅有这一个符号）

F: 终止状态集或可接受状态集，F⊆Q
在这里插入图片描述
从状态q 转移到状态 p，a是下一个输入符号，X是当前栈顶符号，Y是下一个用于替换X的栈顶符号，如下图所示，Y∈Γ∗，

在这里插入图片描述
（图来源网上）

如果Y=ϵ，直接将X从栈顶弹出
如果Y=X，栈顶符号不变还是X
如果Y=Z1Z2…Zk，将X从栈顶弹出，然后将Y压入栈，按从右往左的顺序压入栈，此时Z1位于栈顶
PDA类似NFA，比NFA多了一个stack，正是这个stack使得PDA可以识别一些非正则的语言。输入符号集与栈符号集可能会不同，所以分别用Σ和Γ表示。

fang 0 jun

发布了76 篇原创文章 · 获赞 94 · 访问量 2万+

私信关注

猜你喜欢