Nltk
NP: noun phrase
VP: verb phrase
PP: preposition phrase
文法用途
语言基本可以说是由修饰结构和并列结构拼接而成(不喜勿喷)。比如下面这样不断的扩充:
- he ran
- he ran there
- he saw it there
- the bear saw the font in it
显然正常的句子是第四句,如果将上述过程倒过来从4->1。最终就可以得到两个元素。也就是说:再复合语法规则句子中的词序列可以被一个更小的且不会导致句子不符合语法规则的序列代替。
分析文法的算法
1.下降递归分析:自上而下
2.移进-归约分析:自下而上
3.左角落分析:自下而上过滤的自上而下的方法
4.图表法:动态规划技术
上下文无关文法 CFG(context-free grammar)
Python nltk & stanford nlp