研究目的和意义: 随着信息技术的高速发展,数据的收集与存储技术不断进步,导致大量的数据积累下来,要从海量数据中提取有用的信息成为一项挑战。在这种情况下,数据挖掘技术诞生了,数据挖掘是从大量有噪声的、模糊而随机的数据中提取出对人们有用的信息,这些信息可能不被人们预先知晓,但又存在着潜在的价值。分类和聚类分析都是数据挖掘中的主要功能。所谓分类,是根据预先定好的一些特征值对数据进行分类,这里的类是预先确定好的,只需要将各个数据具体属于哪一类标记出来。与分类不同,在聚类过程中,人们不必事先给出聚类准则,也不需要任何先验知识,仅仅从数据本身出发,自动进行分类。因而聚类分析又称为无监督分类。 聚类算法作为聚类分析的有力工具,已被广泛应用于许多领域中,例如在图像处理中进行图像分割,在模式识别中进行语音识别等。本课题研究的是模糊C-均值(FuzzyC-means,FCM)聚类算法在图像分割中的应用。事实上,由于图像的复杂性,图像中的某个像素点到底属于图像分割的那个区域是不确定的,这也说明了图像的模糊性与不均匀性,所以一般的聚类方法已不能满足人们对图像分割的需求。模糊理论的出现恰好能解决这一问题,将模糊理论应用于聚类形成模糊聚类,所以图像分割就可以从模糊聚类的角度来进行。模糊聚类算法作为图像分割的有力工具,未来对图像分割算法的深入研究将显得很有意义。故本课题研究的FCM聚类算法是一种能有效针对图像中模糊性与不均匀性的图像分割算法,该算法令图像中的每一个像素点都对各类有一定的隶属度值,取值范围为[0,1],另外由于该算法具有非监督模糊聚类的特性,所以利用这一特性进行图像分割,可以减少人为干预,自动完成分割。www.eeELW.com 课题研究现状: FCM聚类算法描述简单,易于实现,是目前应用较广泛的一种模糊聚类图像分割算法。但传统FCM聚类算法在图像分割存在着很多问题,例如初始值难以确定、分割图像时对噪声敏感、空间领域信息被忽略等问题。目前,许多研究学者在FCM聚类算法的基础上进行了多种的改进,大致分为两方面的改进,一方面引入优化算法进行改进,另一方面基于目标函数进行改进。 课题研究主要内容、实施方案及创新点: 本课题将通过图像分割仿真实验发现传统FCM聚类算法在图像分割中存在的问题,并针对这些问题进行改进。改进的基本方法是基于传统FCM聚类算法的目标函数进行改进的。 本课题将从以下几点基于传统FCM聚类算法的目标函数进行改进 (1)将传统的欧式距离用一种非欧式距离代替,改善传统的欧式距离对噪声敏感的问题。再此基础上,将归一化条件,即每个样本对各类隶属度的和为1的条件放松,使所有样本对各类隶属度的总和为,改善聚类效果受离群点和样本分布不均衡影响的问题。 (2)引入高斯核函数,将输入空间的样本,映射到高维特征空间中,使原空间中非线性可分的问题,转化为线性可分,同时优化了样本的特征,最后的聚类是在特征空间中完成的。 (3)将非欧式距离、放松的归一化条件以及高斯核函数三者融合在一起就形成了本课题所提出的改进算法。 最后通过图像分割仿真对比试验验证本文改进算法的有效性。 |