10.3772/j.issn.1000-0135.2013.03.010
一种考虑数据类大小和密度差异的模糊聚类有效性指标
聚类有效性指标用于评价聚类质量和确定最佳聚类数,针对包含大小和密度差异性较大数据类的数据集,在分析了传统模糊聚类有效性指标不足的基础上,提出了一个同时考虑紧致性、重叠度和分离性的聚类有效性指标COS.类内紧致性用一定阈值内的隶属度之和与最大类内距离之比表示,一定阈值内各样本同属于两个类的隶属度差异反映了这两个类的重叠度,类间分离性的度量为最小类间距离,使COS指标值最大的聚类数即为最佳聚类数.在四个人工数据集和iris真实数据集上利用模糊C均值算法进行聚类实验的结果表明,COS指标可以有效发现小类和低密度类.
模糊C均值聚类、聚类有效性指标、大小和密度、COS指标
32
TP3;P63
国家高技术研究发展计划863计划2011AA05A116;国家自然科学基金重点项目71131002
2013-04-22(万方平台首次上网日期,不代表论文的发表时间)
共8页
306-313