目录
图分析(graph analytics)的目的是发掘隐藏在图中的统计规律或潜在结构。
PageRank算法是无监督学习方法,主要是发现有向图中的重要结点。
给定一个有向图,定义在图上的随机游走即马尔可夫链。
随机游走者在有向图上随机跳转,到达一个结点后以等概率跳转到链接出 去的结点,并不断持续这个过程。
PageRank算法就是求解该马尔可夫链的平稳分布的算法。
Page Rank
一个结点上的平稳概率表示该结点的重要性,称为该结点的PageRank值。被指向的结点越多,该结点的PageRank值就越大。被指向的结点的PageRank值越大,该结点的PageRank值就越大。PageRank值越大结点也就越重要。
图是一个简单的有向图,有
4
个结点
A,B,C,D
。
给定这个图,
PageRank
算法通过迭代求出结点的
PageRank
值。
首先, 对每个结点的概率值初始化,表示各个结点的到达概率,假设是等概率的。下一步, 各个结点的概率是上一步各个结点可能跳转到该结点的概率之和。不断迭代,各个结点的到达概率分布趋于平稳分布,也就是PageRank值的分布。
扫描二维码关注公众号,回复:
12923674 查看本文章