10.3969/j.issn.1673-629X.2018.06.020
K均值聚类算法的研究与优化
聚类分析是数据挖掘的重要组成部分,K均值聚类算法是聚类分析方法中一种基本的划分式方法,也是无监督的机器学习方法.其具有效率高、容易理解和实现等优点,同时,可以对多种数据类型进行聚类,广泛应用于诸多领域.但是,K均值聚类算法也有一些局限性.算法中合理的k值难以确定,而且算法选择初始聚类中心的随机性会导致聚类结果不稳定,同时,算法对噪声和离群点数据也有很强的敏感性.为了解决初始聚类中心随机性的问题,通过全局化思想对K均值聚类算法进行了改进,改进的聚类效果评价使用常用的误差平方和准则.实验结果表明,相较于一般的K均值聚类算法,全局K均值聚类算法得到了更好的聚类效果,同时提升了算法的稳定性.
数据挖掘、K均值聚类、中心点、误差平方和
28
TP393(计算技术、计算机技术)
广西壮族自治区中青年教师基础能力提升项目KY2016YB026;广西自然科学基金2014GXNSFBA118274
2018-07-04(万方平台首次上网日期,不代表论文的发表时间)
共3页
90-92