10.19678/j.issn.1000-3428.0065422
一种划分聚类k值与中心初始化的改进方法
划分聚类方法由于结构清晰、时间效率高而得到广泛的应用,但在缺乏先验知识的实际工业过程中难以合理地进行簇数和中心初值选取,导致聚类处理效果大打折扣.针对利用误差平方和方法获得的肘部点不明显的问题,提出考虑比例主偏差的误差平方和方法(PPD-SSE).在误差平方和的基础上引入主偏差项以加强肘部点附近趋势,同时通过引入比例值避免趋势突变,从而更加准确地进行簇数选择.针对利用k-means++方法选取高维数据初始中心时过于随机的问题,提出轮盘重构的k-means++方法(RWR-kmeans++).利用与已选中心的距离平方,并结合概率下限的方法来重构概率轮盘,提升相异数据被选中的概率,降低初值选取的随机性,提升聚类效果并使之更加稳定.在UEA&UCR公开数据集上的实验结果表明,所提PPD-SSE方法能够有效提升肘部偏折角及簇数预测的准确性,RWR-kmeans++方法能够有效提升初值选取的相异性及聚类效果.
划分聚类、比例主偏差、轮盘重构、簇数选择、初值选取
49
TP391(计算技术、计算机技术)
国家自然科学基金62073345
2023-11-16(万方平台首次上网日期,不代表论文的发表时间)
共9页
85-93