一种有效的分类型数据聚类方法
鉴于传统的K-means聚类算法只限于处理数值型数据,将K-means算法扩展到分类型数据域,提出一种分类型数据聚类方法.根据与每个分类属性的每个值相关的数据分布信息,同时结合数据的纵向与横向分布来评价数据对象与类之间的差异性,定义了一种新的距离度量.该方法能发现同一属性不同值间的内在关系,并能有效地度量对象间的差异性.用UCI中的数据集对所提算法进行验证,实验结果表明了该算法具有较好的聚类效果.
聚类分析、分类型数据、差异性、域值、共生
26
TP18(自动化基础理论)
国家自然科学基金10926189;10871031;湖南省自然科学衡阳联合基金10JJ8008
2012-04-21(万方平台首次上网日期,不代表论文的发表时间)
1542-1544,1548