DOI：10.3969/j.issn.1673-5862.2009.04.018

K均值聚类算法初始质心选择的改进

引用

摘要：

聚类分析在信息检索和数据挖掘等领域都有很广泛的应用,K均值聚类算法是一个比较简洁和快速的聚类算法,但是它存在着初始聚类个数必须事先设定以及初始质心的选择也具有随机性等缺陷,造成聚类的结果不是最优的.针对K均值聚类算法中的随机指定初始质心的缺点,提出了基于密度和最近邻相似度的初始质心选择算法,实验显示该算法可以生成质量较高而且较稳定的聚类结果,但是改进的算法需要事先设定最近邻相似度的阈值计算量较大等缺点,还有待改进.

关键词：聚类、K均值聚类算法、初始质心、密度、最近邻相似度

所属期刊栏目：27

分类号：TP301(计算技术、计算机技术)

资助基金：国家自然科学基金资助项目60970112

在线出版日期：2009-12-25（万方平台首次上网日期，不代表论文的发表时间）

页数：共3页

页码：448-450

英文信息展示

期刊专题