几种聚类算法的比较_应用数学专业.doc

需要金币：1000 个金币
资料包括：完整论文
转换比率：金钱 X 10=金币数量，即1元=10金币
论文格式：Word格式(*.doc)
更新时间：2014-09-24
论文字数：13715
当前位置：论文阅览室 > 论文模板 > 论文选题 >
课题来源：（love音乐）提供原创文章

摘要：现在社会处于大数据时代，各行各业的巨量数据都需要先进行数据处理后才能使用，这时候就需要先用聚类分析法对这些数据进行筛选。随着数据容量的不断扩充，聚类分析各算法处理数据的效率问题开始突现出来。本文通过对聚类分析常用的四种算法的定义进行比对，分析他们的不同之处。然后找到这四种算法最具代表性的最新的算法--K-modes、K-均值、最近邻、两部步骤法，通过matlab的编程实现，然后把UCI机器学习数据集储存库中的鸢尾花、酒、豌豆、动物园四个数据集进行实验，并计算出每种方法的处理时间和正确率；然后在引用了一个较大的数据集，再次实验。然后用Weka数据挖掘软件对这五个数据实验，综合得出效率最高的聚类分析法。研究的目的是为大数据聚类分析找到一个便捷快速的途径。

关键字：Matlab 时间函数实验聚类 NP难问题

摘要

Abstract

一、引言 3

（一）聚类分析的简介 3

（二）聚类过程 3

（三）聚类分析的应用 3

（四）聚类分析对聚类算法的要求 4

二、主要的聚类算法分析 5

（一）顺序聚类 7

（二）层次聚类 8

（三）划分聚类10

（四）基于密度的聚类11

（五）基于网格的聚类13

三、实验14

（一）数据集14

（二）时间函数14

（三）实验17

（四）更大数据集的测试18

（五）Weka下的聚类实验 19

（六）结论19

四、总结20

参考文献 21

上一篇：几类欧式期权定价问题的差分方法_应用数学专业.doc
下一篇：减肥健身模型中的最优化问题研究_应用数学专业.doc

网站服务指南