摘要:随着互联网络的发展和移动通信的普及,网络社交将逐渐替代一部分传统的社交方式,而网络社交中的一项最基本的交流,资源的交流即可以在一定程度上反映人类的社交网络。通过对资源共享网网站数据信息进行数据挖掘和分析,可以发现用户的个性特征,比如性别、年龄等,也可以发现用户的关系网络。而这些信息不仅可以反映出使用该资源共享网站的用户的大概性别、年龄,还可以发现潜在的商机。通过对不同用户的关注度等分析,向其提供其感兴趣的资源,并且可以通过不同的年龄段的用户的数量,来改变网站资源的更新及侧重方向,来进行危机预警,还可以对即将发布的资源的传播效果进行一下小幅度的预测。本论文主要是利用Python中的数据分析的相关模块对资源共享网站的用户行为进行分析,主要的分析方向为用户关系网络分析和用户行为分析,主要使用的数据分析模块为Pandas和networkx,最终得出用户关系网络图以及基于用户、标签、时间的用户行为分析图,并且得出结论。然后再利用Python的GUI(本文中使用的是PyQt4)绘制系统界面,并利用Python语言编写资源共享网站的用户行为分析系统的程序代码,在系统程序中显示界面并调用数据分析的程序,系统能够实现导入数据源文件、进行不同方向的数据分析、显示数据分析的结果。
关键词:数据分析;网络关系;用户行为;资源共享
目录
摘要
Abstract
1绪论-1
1.1课题产生的背景-1
1.2课题研究的目的-1
1.3课题的主要任务及内容-2
2 系统设计理论知识-3
2.1Python语言简介-3
2.1.1Python简介-3
2.1.2Python发展历史-3
2.1.3Python特点-3
2.2 Python数据分析库简介-4
2.2.1Pandas库简介-4
2.2.2Matplotlib库简介-5
2.2.3Networkx库简介-5
2.3 Python GUI简介-5
2.3.1GUI简介-5
2.2.2PyQt简介-6
3 数据分析-7
3.1数据介绍-7
3.2 关系网络分析-8
3.2.1关系网络分析概述-8
3.2.2关系网络图-10
3.2.3节点统计-11
3.2.4连边的统计-12
3.2 行为分析-13
3.2.1基于用户的行为分析-13
3.2.2基于标签的行为分析-14
3.2.3基于时间的行为分析-15
4 系统设计-17
4.1UI界面设计-17
4.1.1预期界面-17
4.1.2界面设计过程-17
4.1.3实现界面-18
4.2系统功能设计-18
4.2.1显示GUI窗口-18
4.2.2事件处理-19
4.2.3系统调试-19
结 论-22
参 考 文 献-23
附录A 数据分析代码-24
附录B 系统代码-27
致 谢-30