TextRank算法提取关键词的Java实现

TextRank算法提取关键词的Java实现
谈起自动摘要算法,常见的并且最易实现的当属TF-IDF,但是感觉TF-IDF效果一般,不如TextRank好。TextRank是在Google的PageRank算法启发下,针对文本里的句子设计的权重算法,目标是自动摘要。它利用投票的原理,让每一个单词给它的邻居(术语称窗口)投赞成票,票的权重取决于自己的票数。这是一个“先有鸡还是先有蛋”的悖论,PageRank采用矩阵迭代收敛的方式解决了这个悖论。TextRank也不例外:PageRank的计算公式:正规的TextRank公式正规的TextRank公式在Pa...

继续阅读码农场 » TextRank算法提取关键词的Java实现

原文链接http://www.hankcs.com/nlp/textrank-algorithm-to-extract-the-keywords-java-implementation.html

转载于:https://my.oschina.net/hankcs/blog/342185

猜你喜欢

转载自blog.csdn.net/weixin_34318326/article/details/91780479