10.3778/j.issn.1002-8331.1306-0118
一种高维混合属性数据聚类算法
在许多应用中,很多数据集都具有数值型和分类型数据的混合特征,k-prototype是针对这类数据聚类的经典方法之一,该方法是一种基于k-means和k-mode的聚类方法。在研究了现有的混合属性数据聚类方法之后,引入了一种新算法用于混合型数据聚类,不仅改进了prototype的选取方法,而且提出了一种新的针对混合型数据的相似度度量方式,基于此又提出了一种不同于k-prototype的数据到prototype的分配方式,采用类似层次聚类中凝聚聚类的思想进行聚类,通过在四个真实的混合型数据集上测试发现:与传统算法相比,算法提高了聚类的精度和稳定性。
聚类、混合型数据、相似度计算、层次聚类
TP301(计算技术、计算机技术)
国家自然科学基金No.61170130。
2015-04-27(万方平台首次上网日期,不代表论文的发表时间)
共6页
128-133