10.3778/j.issn.1002-8331.1307-0079
基于密度期望和有效性指标的K-均值算法
传统K-均值聚类算法虽然收敛速度快,但存在聚类数k无法预先确定,并且算法对初始中心点敏感的缺点。针对上述缺点,提出了基于密度期望和聚类有效性Silhouette指标的K-均值优化算法。给出了基于密度期望的初始中心点选取方案,将处于密度期望区间内相距最远的k个样本作为初始聚类中心。该方案可有效降低K-均值算法对初始中心点的依赖,从而获得较高的聚类质量。在此基础上,可进一步通过选择合适的聚类有效性指标Silhouette指标分析不同k值下的每次聚类结果,确定最佳聚类数,则可有效改善k值无法预先确定的缺点。实验及分析结果验证了所提出方案的可行性和有效性。
K-均值聚类、初始聚类中心点、期望密度、k值优化
TP18(自动化基础理论)
黑龙江省自然科学基金No.F201134;黑龙江省教育厅科学技术研究项目No.12531120。
2013-12-19(万方平台首次上网日期,不代表论文的发表时间)
共7页
105-111