基于密度期望和有效性指标的K-均值算法

引用

摘要：

传统K-均值聚类算法虽然收敛速度快，但存在聚类数k无法预先确定，并且算法对初始中心点敏感的缺点。针对上述缺点，提出了基于密度期望和聚类有效性Silhouette指标的K-均值优化算法。给出了基于密度期望的初始中心点选取方案，将处于密度期望区间内相距最远的k个样本作为初始聚类中心。该方案可有效降低K-均值算法对初始中心点的依赖，从而获得较高的聚类质量。在此基础上，可进一步通过选择合适的聚类有效性指标Silhouette指标分析不同k值下的每次聚类结果，确定最佳聚类数，则可有效改善k值无法预先确定的缺点。实验及分析结果验证了所提出方案的可行性和有效性。

关键词：K-均值聚类、初始聚类中心点、期望密度、k值优化

分类号：TP18(自动化基础理论)

资助基金：黑龙江省自然科学基金No.F201134；黑龙江省教育厅科学技术研究项目No.12531120。

在线出版日期：2013-12-19（万方平台首次上网日期，不代表论文的发表时间）

页数：共7页

页码：105-111

英文信息展示

期刊专题