基于密度敏感距离的改进模糊C均值聚类算法

引用

摘要：

模糊C均值(FCM)聚类算法无法识别非凸数据,算法中基于欧式距离的相似性度量只考虑数据点之间的局部一致性特征而忽略了全局一致性特征.提出一种利用密度敏感距离度量创建相似度矩阵的FCM算法.通过近邻传播算法获取粗类数作为最佳聚类数的搜索范围上限,以解决FCM算法聚类数目需要人为预先设定和随机选定初始聚类中心造成聚类结果不稳定的问题.在此基础上,改进最大最小距离算法,得到具有代表性的样本点作为初始聚类中心,并结合轮廓系数自动确定最佳聚类数.基于UCI数据集和人工数据集的实验结果表明,相比经典FCM、K-means和CFSFDP算法,该算法不仅具有识别复杂非凸数据的能力,而且能够在保证聚类性能和稳定性的前提下加快收敛速度.

关键词：模糊C均值聚类算法、密度敏感距离、近邻传播、初始聚类中心、轮廓系数

所属期刊栏目：47

分类号：TP18(自动化基础理论)

资助基金：国家自然科学基金61962054

在线出版日期：2021-05-17（万方平台首次上网日期，不代表论文的发表时间）

页数：共10页

页码：88-96,103

英文信息展示

期刊专题