对k-means初始聚类中心的优化
针对传统k-means算法对初始聚类中心敏感的问题,提出了基于数据样本分布选取初始聚类中心的改进k-means算法.该算法利用贪心思想构建K个数据集合,集合的大小与数据的实际分布密切相关,集合中的数据彼此间相互靠近.取集合中数据的平均值作为初始聚类中心,由此得到的初始聚类中心非常接近迭代聚类算法期待的聚类中心.理论分析和实验结果表明,改进算法能改善其聚类性能,并能得到稳定的聚类结果,取得较高的分类准确率.
聚类、k-means算法、数据分布、初始聚类中心、改进算法
32
TP301(计算技术、计算机技术)
国家自然科学基金项目50674086
2011-12-19(万方平台首次上网日期,不代表论文的发表时间)
共4页
2721-2723,2788