DOI：10.3969/j.issn.1672-9870.2015.04.033

一种高效的基于初始聚类中心优化的K-means算法

引用

摘要：

为解决传统K-means算法初始质心的随机选取以及聚类过程中每个数据样本到聚类中心距离的重复计算问题，提出了一种高效的基于初始聚类中心优化的K-means算法，采用最小方差优化初始质心，通过存储每次迭代中所有数据点的簇标志和到最近聚类中心的距离并用于下一次迭代，避免了重复计算数据点到每个中心的距离。在UCI数据库中五个不同的数据集上进行了测试，对各个算法在聚类准则函数，运行时间以及迭代次数上进行实验结果比较，表明在不降低聚类性能的前提下，减少了迭代次数，缩短了聚类时间，证明了改进算法的有效性和高效性。

关键词：K-means算法、方差、初始聚类中心、距离、时间

分类号：TP391(计算技术、计算机技术)

在线出版日期：2015-09-18（万方平台首次上网日期，不代表论文的发表时间）

页数：共5页

页码：154-158

英文信息展示

期刊专题