摘要:近年来,移动社交网络迅猛发展,各种社交APP如雨后春笋般涌现,逐渐影响着人们的日常生活,甚至改变了人们的行为方式。人们每天在社交网络上产生海量的数据。因此对社交网络用户属性的研究是一项非常重要的工作。
本文对38万移动社交网络用户数据进行了分析,主要研究了基于表示学习的移动社交网络用户年龄预测方法。在预测中,使用了10种基于社交网络结构的推断算法。同时,将Node2vec这种表示学习方法引入用户年龄预测中,使用用户一阶和二阶邻居节点信息进行节点的向量化表达,然后运用机器学习XGBoost算法预测用户的年龄。研究发现当用户的好友数较少时,基于Node2vec的节点嵌入方法预测精度较高;当用户的好友数较多时,使用基于网络结构的推断算法(用户所有好友的平均年龄预测)得出最好结果。
关键词:社交网络;年龄预测;Node2vec;表示学习
目录
摘要
Abstract
1 绪论-1
1.1 研究背景及意义-1
1.2 国内外研究现状-2
1.3 本文主要研究内容-3
2 相关技术-4
2.1 Word2vec-4
2.1.1 词向量-4
2.1.2 神经网络语言模型-4
2.1.3 Word2vec模型-6
2.2 Node2vec-7
2.3 本章小结-9
3 XGBoost算法-10
3.1 XGBoost算法的优点-10
3.2 XGBoost算法的目标函数-10
3.3 基于XGBoost算法的预测模型-12
3.4 本章小结-12
4 社交网络中用户年龄预测-14
4.1 整体设计思路-14
4.2 数据说明与简要分析-14
4.3 基于社交网络拓扑结构的用户年龄预测-16
4.3.1 待测用户的社交网络-16
4.3.2 基于社交网络拓扑结构的推断方法-17
4.3.3 评价指标-20
4.3.4 基于社交网络拓扑结构推断方法的结果分析-20
4.4 基于表示学习的用户年龄预测-21
4.5 用户年龄预测结果分析-21
4.6 本章小结-22
结 论-23
参 考 文 献-24
附录A 主程序-26
致 谢-30