对k-means初始聚类中心的优化

引用

摘要：

针对传统k-means算法对初始聚类中心敏感的问题,提出了基于数据样本分布选取初始聚类中心的改进k-means算法.该算法利用贪心思想构建K个数据集合,集合的大小与数据的实际分布密切相关,集合中的数据彼此间相互靠近.取集合中数据的平均值作为初始聚类中心,由此得到的初始聚类中心非常接近迭代聚类算法期待的聚类中心.理论分析和实验结果表明,改进算法能改善其聚类性能,并能得到稳定的聚类结果,取得较高的分类准确率.

关键词：聚类、k-means算法、数据分布、初始聚类中心、改进算法

所属期刊栏目：32

分类号：TP301(计算技术、计算机技术)

资助基金：国家自然科学基金项目50674086

在线出版日期：2011-12-19（万方平台首次上网日期，不代表论文的发表时间）

页数：共4页

页码：2721-2723,2788

英文信息展示

期刊专题