10.3969/j.issn.1672-9870.2015.05.032
基于最小方差的自适应K-均值初始化方法
K-均值算法对初始聚类中心敏感,聚类结果随不同初始聚类中心波动.针对以上问题,提出一种基于最小方差的自适应K-均值初始化方法,使初始聚类中心分布在K个不同样本密集区域,聚类结果收敛到全局最优.首先,根据样本空间分布信息,计算样本方差得到样本紧密度信息,并基于样本紧密度选出满足条件的候选初始聚类中心;然后,对候选初始聚类中心进行处理,筛选出K个初始聚类中心.实验证明,算法具有较高的聚类性能,对噪声和孤立点具有较好的鲁棒性,且适合对大规模数据集聚类.
聚类、K-均值、方差、初始聚类中心
38
TP391(计算技术、计算机技术)
2015-12-01(万方平台首次上网日期,不代表论文的发表时间)
共6页
140-144,149