10.3969/j.issn.1002-137X.2010.11.051
面向结构稳定性的分裂-合并聚类算法
聚类是在假设数据具有某种群聚结构的前提下根据观察到的无标记样本发现数据的最优划分.现有的聚类算法通常简单地导出假设结构和给定先验下最优或较优的聚类结果,体现为算法对样本分布拟合度的迭代最优化,即算法有效性.实际上,聚类的有效性取决于结构有效性、算法有效性和先验有效性3个方面的因素.基于这种考虑,提出了一种变体混合模型的聚类结构假设,以及判定聚类结构的稳定性的度量和方法,在算法有效的前提下通过单簇的分裂与合并来改进聚类结构的稳定性,并得到最终聚类结果,设计并实现了SMClus聚类算法,通过对模拟数据和真实数据的聚类实验,例证了方法的有效性.
聚类算法、变体混合模型、结构稳定性、分裂-合并
37
TP181(自动化基础理论)
863国家高技术研究发展计划2006AA12Z217;中国矿业大学科技基金OD080313
2011-01-28(万方平台首次上网日期,不代表论文的发表时间)
共6页
217-222