实体统一算法

问题定义:给定两个实体,判断是否指向同一个实体?(本质:0和1 的问题)
例如:str1 str2 是否统一实体?
第一种办法:计算str1和str2之间的相似度,使用边际距离算法。
第二种办法:基于规则的方法,通常用于地理名、公司名消除歧义。
基于图的实体统一
在这里插入图片描述
核心:计算A和B之间的相似度,即A的周围提取特征,B的周围提取特征,再计算A B 之间相似度
怎么从图中生成特征?
冲突中可以看出,我们可以提取如下特征:1、A节点本身的特征 2、A的度 3、与哪些节点相连? 同理得出B的特征,然后进行相似度计算,如果相似度比较大则认为是同一个人,进行合并;反之则保持不变。

猜你喜欢

转载自blog.csdn.net/qq_38851184/article/details/114440977