10.3778/j.issn.1002-8331.1901-0095
融合单纯形映射与熵加权的聚类方法
由于分类型和数值型属性特性的差异,设计混合类型数据聚类算法时通常需要对两种类型属性区别对待,增加了聚类算法的设计与实现难度.另外,不同属性所包含的信息量存在差异,但现有算法通常平等对待各个属性.提出了一种融合单纯形映射与信息熵加权的混合类型数据聚类算法.基于单纯形理论将分类型属性映射为高维数值属性向量,应用信息熵理论为各属性分配权重建立相似性度量公式,将该度量方法应用于K-Means算法框架得到聚类算法.在6个UCI的混合数据集上的实验表明,提出的聚类算法优于传统映射聚类算法和K-Prototype算法,在准确度上分别提高了2.70%和18.33%.
向量映射、熵加权、相似性度量、混合数据集、聚类分析
56
TP391(计算技术、计算机技术)
安徽省重点研究;开发计划;国家高等学校学科创新引智计划"111"
2020-05-11(万方平台首次上网日期,不代表论文的发表时间)
共8页
148-155