依赖数据密度的K均值初始化调优

引用

摘要：

K均值算法虽被广泛应用，但其算法性能和算法稳定性严重依赖算法的初始化过程，尤其是初始聚类中心的选取。比较合理的聚类中心应该出现在数据密集的区域，基于这个假设，提出了一种依赖数据局部密度的初始化调优算法。该算法以数据的局部密度函数为依据，并在高密度区域选取初始聚类中心。与同类算法相比，该算法有如下特点：能够自主发现数据集中数据分布的局部密集度；对类别数目较多的数据表现出更好的性能；对离群点和噪声鲁棒；易于实现。

关键词：聚类、K均值算法、聚类中心、密度函数

分类号：TP393(计算技术、计算机技术)

在线出版日期：2014-06-19（万方平台首次上网日期，不代表论文的发表时间）

页数：共7页

页码：139-144,166

英文信息展示

期刊专题