10.16208/j.issn1000-7024.2023.01.024
非独立同分布下的K-Modes算法
传统的K-Modes算法中,初始聚类中心是随机选取的,聚类结果过分依赖初始聚类中心的选择,影响聚类效果.在很多K-Modes算法的研究中假设数据是独立同分布的,在现实的数据中,数据对象和属性之间是根据某些耦合关系彼此关联的,是非独立同分布的.针对这两方面问题,通过基于层次聚类进行预聚类的方法改进选取初始中心的方法,引入非独立同分布思想计算相异度量,进行实验验证.实验结果表明,通过改进初始中心的选取方法和相异度量的计算方法很好改进了K-Modes算法,提高了算法的聚类精度.
K-Modes算法、初始中心、独立同分布、非独立同分布、耦合关系、层次聚类、相异度度量
44
TP391(计算技术、计算机技术)
国家自然科学基金61502259
2023-02-10(万方平台首次上网日期,不代表论文的发表时间)
共6页
182-187