10.3969/j.issn.1672-9722.2018.01.006
优化初始聚类中心及确定K值的K-means算法
K-means聚类算法中,我们需要输入两个参数,一个是聚类数K,另一个是初始聚类中心,初始聚类中心的选择对聚类结果有较大的影响,传统的K-means聚类算法随机挑选K个聚类中心,而随机挑选的聚类中心难免会取到孤立点,这将对聚类结果产生很大的影响.K值是用户输入,K值选取的不好也将影响聚类效果.论文提出了一种改进的K-means聚类算法,先根据类簇指标确定需要聚类的数K,之后采用基于密度的思想,首先将聚类样本分为核心点、边界点和孤立点,之后排除孤立点和边界点并取核心点的中心点作为K个聚类中心后再进行K-means聚类,实验表明改进后的算法比原始的K-means聚类算法准确性更高.
K-means聚类、聚类数、聚类中心、密度、孤立点
46
TP301.6(计算技术、计算机技术)
2018-03-05(万方平台首次上网日期,不代表论文的发表时间)
共5页
21-24,113