DOI：10.3969/j.issn.1672-058X.2012.08.011

一种对K-means算法的改进

引用

摘要：

数据聚类是一个功能强大的技术,它能够把数据特征相似的对象划分为一类,但是并不是所有的聚类算法的实现都能产生相同的聚类结果;并且K均值算法的结果很大程度上依赖它的初始中心的选择;提出了一种新颖的关于K均值初始中心选择的策略;该算法是基于反向最近邻（RNN）搜索,检索一个给定的数据集,其最近的邻居是一个给定的查询点中的所有点;使用这种方法计算初始聚类中心结果发现是非常接近聚类算法所需的迭代聚类中心;对提出的算法应用到K均值聚类中给予了证明;用几种流行的数据集的实验结果表明了该算法的优点。

关键词：聚类、最近邻查询、反向最近邻搜索、K均值

所属期刊栏目：29

分类号：TP305(计算技术、计算机技术)

在线出版日期：2012-09-11（万方平台首次上网日期，不代表论文的发表时间）

页数：共5页

页码：47-51

英文信息展示

期刊专题