自然语言处理综论-第10章小结-基于上下文无关语法的剖析

自然语言处理综论-第10章小结-基于上下文无关语法的剖析


本章介绍了很多材料。本章中最重要的两个思想是关于剖析的思想和关于局部剖析的思想。下面是本章中这些思想的要点:

  • 剖析可以看成一个搜索问题。
  • 两种最常见的搜索是自顶向下搜索(从根开始朝着输入单词向下长出树形图)和自底向上搜索(从单词开始朝着树根S向上长出树形图)。
  • 一个简单的剖析算法是下图中的自顶向下、深度优先、从左向右的剖析器。
    在这里插入图片描述
  • 自顶向下剖析可以使用左角表来优先处理那些与输入匹配的非终极符号,从而提高剖析器的效率。
  • 歧义、左递归、子树的重复剖析是这种简单剖析算法的普遍问题。
  • 如果语法给一个句子指派一个以上的可能剖析,那么这个句子就是有结构歧义的。
  • 常见的结构歧义有PP附着歧义、并列连接歧义、名词短语层次歧义。
  • 动态规划剖析算法使用一个局部剖析的表来有效地剖析歧义句子。Earley算法是自顶向下的动态规划算法,而CYK算法则是自底向上的动态规划算法。
  • 有些信息抽取问题可以不使用完全剖析来解决,而可以通过层叠式FSA来解决。

猜你喜欢

转载自blog.csdn.net/qq_17065591/article/details/108420367