版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/u012736685/article/details/84784690
引入
社交网络,如何存储微博、微信等这些社交网络的好友关系?
==》图
一、图(Graph)的相关概念
- 图:复杂的非线性表结构;
- 顶点(vertex):图中的元素;
- 边(edge):图中一个顶点可以与任意其他顶点建立连接关系。
- 顶点的度(degree):与顶点相连接的边的条数
- 无向图:边没有方向的图;
- 有向图:边存在方向的图;
- 有向图中度分为入度(in-degree)和出度(out-degree)
- 入度:表示有多少条边指向这个顶点;
- 出度:表示有多少条边是以这个顶点为起点指向其他节点。
- 以微博为例,入度:粉丝数,出度:关注人数
- 带权图(weighted graph):每条边都有一个权重(weight),例如:QQ好友之间的亲密度。
二、图的存储
1、邻接矩阵存储方法
- 直观、简单、方便计算、高效获取两个顶点关系,但较为浪费存储空间(存储的是稀疏图( Sparse Matrix )、无向图只需用其对角线划分的上(下)部分就足够)。
邻接矩阵(Adjacency Matrix):一个二维矩阵。
具体来说:对于无向图来说,如果顶点 i 与顶点 j 之间有边,我们就将 A[i][j] 和 A[j][i] 标记为 1;对于有向图来说,如果顶点 i 到顶点 j 之间,有一条箭头从顶点 i 指向顶点 j 的边,那我们就将 A[i][j] 标记为 1。同理,如果有一条箭头从顶点 j 指向顶点 i 的边,我们就将 A[j][i] 标记为 1。
2、邻接表(Adjacent List)存储方法
- 每个顶点对应一条链表,链表中存储的是与该顶点相连的其他节点;
- 在有向图的邻接表存储方式中,每个顶点对应的链表中,存储的是指向的顶点;
- 在无向图的邻接表存储方式中,每个顶点对应的链表中,存储的是跟该顶点有边相邻的顶点;
==》时间、空间复杂度互换的设计思想
==》邻接矩阵存储起来比较浪费空间,但是使用起来比较节省时间。相反,邻接表存储起来比较节省空间,但是使用起来就比较耗时间。
访问
eg:要确定,是否存在一条从顶点 2 到顶点 4 的边,那我们就要遍历顶点 2 对应的那条链表,看链表中是否存在顶点 4。
==》链表存储方法对缓存不友好
==》没有邻接矩阵在查询两个顶点之间的关系时那么高效。
改进:邻接表同散列表一样改进
在基于链表法解决冲突的散列表中,如果链过长,为了提高查找效率,我们可以将链表换成其他更加高效的数据结构,比如平衡二叉查找树、平衡二叉树、红黑树、跳表、散列表或有序动态数据等等。
3、分析
存储一个图主要有两种存储方法
- 邻接矩阵
- 邻接表
对于社交网络(稀疏图),使用邻接矩阵存储比较浪费存储空间。==》采用邻接表存储
但是用一个邻接表来存储这种有向图是不够的。我们去查找某个用户关注了哪些用户非常容易,但是如果要想知道某个用户都被哪些用户关注了,也就是用户的粉丝列表,是非常困难的。
==》逆邻接表
- 邻接表中,每个顶点的链表中,存储的就是这个顶点指向的顶点——如果要查找某个用户关注了哪些用户,我们可以在邻接表中查找;
- 逆邻接表中,每个顶点的链表中,存储的是指向这个顶点的顶点。——如果要查找某个用户被哪些用户关注了,我们从逆邻接表中查找。