DOI：10.3969/j.issn.1673-629X.2011.02.016

K-Means聚类算法的研究

引用

摘要：

K-Means算法是一种经典的聚类算法,有很多优点,也存在许多不足.比如初始聚类数K要事先指定,初始聚类中心选择存在随机性,算法容易生成局部最优解,受孤立点的影响很大等.文中主要针对K-Means算法初始聚类中心的选择以及孤立点问题加以改进,首先计算所有数据对象之间的距离,根据距离和的思想排除孤立点的影响,然后提出了一种新的初始聚类中心选择方法,并通过实验比较了改进算法与原算法的优劣.实验表明,改进算法受孤立点的影响明显降低,而且聚类结果更接近实际数据分布.

关键词：K-Means算法、初始聚类中心、孤立点

所属期刊栏目：21

分类号：TP301.6(计算技术、计算机技术)

资助基金：安徽省教育科研重点项目KJ2009A57

在线出版日期：2011-06-14（万方平台首次上网日期，不代表论文的发表时间）

页数：共4页

页码：62-65

英文信息展示

期刊专题