NLP之【点互信息PMI】——衡量两变量之间的相关性

绪论

在自然语言处理中, 想要探讨两个字之间,是否存在某种关系,例如:某些字比较容易一起出现, 这些字一起出现时,可能带有某种讯息。

例如,在新闻报导中,有New 、York,这两个字一起出现,可以代表一个地名New York,所以当出现了New这个字, 则有可能出现York,这可以用Pointwise Mutual Information(PMI)来计算New 、York一起出现的相关性。

一、PMI的基本概念

点互信息(Pointwise Mutual Information,PMI): 在数据挖掘或者信息检索的相关资料里,经常会 利用PMI(Pointwise Mutual Information)这个指标来衡量两个事物之间的相关性

猜你喜欢

转载自blog.csdn.net/weixin_42782150/article/details/127068069