Embedding Knowledge Graphs for Semantics-aware Recommendations based on DBpedia
ABSTRACT
提出使用图嵌入技术的语义感知推荐策略
策略使用图嵌入技术来学习要推荐项目的向量空间表示
三部图(tripartite graph)
由用户、项目(collaborative information)和从DBpedia收集的实体组成(content-based information)。
重点
通过将协作数据点与从DBpedia收集到的信息相结合来学习嵌入技术。
这些嵌入被用来提供正和负例(用户喜欢的项目和她不喜欢的项目),一个分类模型,最后被利用来分类新的项目给目标用户。
BACKGROUND AND MOTIVATIONS
数据集
-
DBpedia
DBPedia是早期的语义网项目。DBPedia意指数据库版本的Wikipedia,是从Wikipedia抽取出来的链接数据集。DBPedia采用了一个较为严格的本体,包含人、地点、音乐、电影、组织机构、物种、疾病等类定义。此外,DBPedia还与Freebase,OpenCYC、Bio2RDF等多个数据集建立了数据链接。DBPedia采用RDF语义数据模型,总共包含30亿RDF三元组
-
Freebase
图嵌入技术的应用
这些方法将图作为输入,并返回一组表示其节点的向量作为输出。这种表示往往保持节点之间的结构等价性,具有相似邻域的节点往往具有相似的嵌入。
提出推荐策略
(1)建立了一个由用户、项目和从DBpedia提取的实体组成的基于图形的数据模型
(2)将Node2Vec和 Laplacian Eigenmaps (LE)图嵌入技术应用于三部图
(3)得到的向量被用来训练一个有正反两个例子的分类模型
(4)这样的模型被用来预测用户对一个新的项目是否感兴趣
创新点
(1)利用从DBpedia收集的用户、项目和实体的三方图,
(2)将推荐问题作为分类问题来解决,利用得到的嵌入作为输入来建立分类模型。
Data Model
介绍了构建知识图谱的过程
三种不同图的拓扑结构
比较证明图嵌入的有效性
-
协同数据模型
只包括用户和项目节点
-
基于DBpedia的数据模型,
包含项目和实体节点
-
完整的数据模型
包括用户、项目和从DBpedia收集的信息
Graph Embedding Techniques
概念
图嵌入是一种将图数据(通常为高维稠密的矩阵)映射为低微稠密向量的过程。图嵌入需要捕捉到图的拓扑结构,顶点与顶点的关系,以及其他的信息 (如子图,连边等)。如果有更多的信息被表示出来,那么下游的任务将会获得更好的表现。在嵌入的过程中存在着一种共识:向量空间中保持连接的节点彼此靠近。
面临的问题
这项任务具有挑战性,因为节点的向量表示应该保留图的结构和单个节点之间的连接
目前解决该问题主要的三种方法
- Factorization-based methods;
- Random Walk-based methods
- Deep Learning-based methods.
参见链接:https://zhuanlan.zhihu.com/p/64200072
我们比较了LE、Node2Vec两种不同的基于知识图的嵌入方法
Recommendation framework
将推荐任务转换为一个分类任务,使用代表用户喜欢的项目的向量作为正例,而将用户不喜欢的那些东西作为负例.然后训练了分类器,.使用分类模型来预测目标用户最感兴趣的项目。测试集中的项目根据分类算法返回的预测的置信度进行排序,并将顶K项返回给目标用户。
训练集
测试集
数据集
MovieLens (ML)
LibraryThing (LT)
Last.fm (LFM)
XMind: ZEN - Trial Version