DOI：10.3969/j.issn.1673-629X.2010.11.032

基于数据分段的K-means的优化研究

引用

摘要：

K-means聚类算法是一种主流的迭代下降聚类算法,收敛于局部最优化状态.由于K-means随机选取k个初始聚类中心,使得聚类结果的有效性随初始输入而波动,为此文中采取一种预处理的方式来选取初始聚类中心.首先在某种范数的意义下,确定相隔最远的两个数据点之间的距离,然后采用数据分段的方法,将数据集分成k段,在每段中选取一个中心,以此来减小聚类结果随初始输入的波动.实验显示优化后的K-means有效地消除了初始输入的影响,并显著地减少了算法迭代次数和聚类误差.

关键词：聚类、K-means、PK-means、聚类中心

所属期刊栏目：20

分类号：TP39(计算技术、计算机技术)

资助基金：青岛市科技计划项目08-1-3-2-jcb

在线出版日期：2011-01-28（万方平台首次上网日期，不代表论文的发表时间）

页数：共4页

页码：130-132,136

英文信息展示

期刊专题