10.3778/j.issn.1002-8331.1709-0211
一种适用于混合型分类数据的聚类算法
传统的K-modes算法采用简单的属性匹配方式计算同一属性下不同属性值的距离,并且计算样本距离时令所有属性权重相等.在此基础上,综合考虑有序型分类数据中属性值的顺序关系、无序型分类数据中不同属性值之间的相似性以及各属性之间的关系等,提出一种更加适用于混合型分类数据的改进聚类算法,该算法对无序型分类数据和有序型分类数据采用不同的距离度量,并且用平均熵赋予相应的权重.实验结果表明,改进算法在人工数据集和真实数据集上均有比K-modes算法及其改进算法更好的聚类效果.
聚类算法、混合型分类数据、距离度量、K-modes算法
55
O212;TP39(概率论与数理统计)
2019-10-30(万方平台首次上网日期,不代表论文的发表时间)
共6页
168-173