摘要:复杂网络的链路预测是指基于网络原有信息预测网络中节点之间产生连边的可能性,比较传统的方法就是利用节点相似性进行预测,但利用这种方法进行预测时也存在诸多的弊端,一般来说,社交网站上的用户信息大多数都是涉及个人隐私的,因此很难获取。本文采用基于共同邻居相似性算法进行链路预测,并将原始网络进行随机化处理,研究网络模体数随网络结构改变而产生的变化,进而分析模体数改变对链路预测结果的影响。
研究的主要内容如下:
(1)网络构建。使用美国航空网络,生成与该网络相对应的0阶、1阶、2阶、2.25阶和2.5阶零模型,再生成具有富人俱乐部特性和匹配特性的零模型网络。
(2)链路预测。使用CN算法进行预测,并计算AUC和precision。
(3)分析。分析总结网络中模体数对链路预测结果的影响。
实验结果表明,在由原始网络生成0阶和1阶零模型网络的过程中,模体数的变化和链路预测的效果变化趋势大致相同,在非富人俱乐部网络和异配网络中,模体数的变化对链路预测的结果也产生了很明显的影响,因此可以通过改变相应的模体数来改善链路预测的效果。
关键词:模体;链路预测;零模型;富人俱乐部网络
目录
摘要
Abstract
1 绪论-1
1.1 研究背景和意义-1
1.2 国内外研究现状-2
1.3 本文研究内容-2
1.4 本文组织结构-2
2 基本理论-3
2.1 社交网络-3
2.2 模体-4
2.2.1 模体的定义-4
2.2.2 模体的结构-5
2.3 零模型-5
2.4 链路预测-5
2.4.1 基于节点相似度的链路预测-5
2.4.2 基于结构相似性的链路预测-6
2.5 链路预测评价指标-6
2.5.1 AUC-6
2.5.2 精确度-7
3 基于模体计算的链路预测-8
3.1 数据描述-8
3.2 技术路线-8
3.3 网络构建-9
3.3.1 0阶零模型的构造算法-9
3.3.2 1阶零模型的构造算法-9
3.3.3 2阶零模型的构造算法-10
3.3.4 2.25阶零模型的构造算法-10
3.3.5 2.5阶零模型的构造算法-11
3.3.6 具有富人俱乐部特性的零模型构造算法-11
3.3.7 具有匹配特性的零模型构造算法-12
3.4 算法实现-13
4 仿真实验-14
结 论-18
参 考 文 献-19
附录A 算法代码-20
致 谢-38