摘要: 随着信息技术的发展,人们不再局限于现实生活中的社交,利用社交网站继续拓宽自己的交际圈已经成为人们社交生活中的一部分,显然在社交网络中你可以认识更多的人。现在的人们可以在网络中更轻松的完成相对于现实生活中更为复杂的交友活动,但是社交网络的爆炸式信息量这一特点也导致了信息冗杂的问题。所以对社交网络进行深入的研究分析就成为了一个重要的课题。
在了解并分析了国内外目前社交网络研究现状的基础下,收集一定用户的数据,本系统主要采取链路预测的方式来进行好友推荐,进行验证分析系统的预测概率,输入用户的ID可以推荐新的潜在好友,使用户能更快地建立好友关系网络,从而提高用户在社交网站中的体验及用户的活跃程度。本文对Python涉及到的数据知识、复杂网络理论和链路预测等相关技术及推荐系统中的常用推荐算法进行了深入的研究。本论文采取了数十万的用户数据来验证并得到结果。
关键词:好友推荐;社交网络;链路预测;数据描述性统计
目录
摘要
Abstract
1 绪论-1
1.1 课题产生的背景-1
1.2 课题研究的目的-1
1.3 课题的主要任务及内容-2
2 相关理论与技术-3
2.1-pandas的数据结构-3
2.1.1 Series概念-3
2.1.2-索引功能-3
2.2-推荐评价指标-4
2.3-Scikit-learn函数-4
2.4 传统互联网推荐系统的概述-5
2.4.1 协同过滤推荐-5
2.4.2 基于内容的推荐-5
2.4.3 基于规则的推荐-6
2.4.4 混合推荐-6
3 Python数据分析-7
3.1 数据导入-7
3.2 数据变换-8
4 好友推荐系统-9
4.1 基于社交因素的对比-9
4.2 基于签到行为的对比-10
4.3 基于社交关系和签到行为的潜在好友推荐算法-12
4.3.1 算法总体思想-12
4.3.2 算法描述-12
4.4 欧几里得距离相似性算法-13
4.5 好友推荐系统分析-13
4.5.1 数据说明-13
4.5.2 数据处理-14
4.6 好友推荐系统设计-16
4.6.1 链路预测-16
4.6.2 系统结果-18
结 论-22
参 考 文 献-23
附录A 好友推荐系统主程序-24
附录B 链路预测数据统计程序-26
致 谢-28