10.11896/j.issn.1002-137X.2016.9.041
一种基于抽样的大规模混合数据聚类集成算法
混合数据聚类是聚类分析中一个重要的问题.现有的混合数据聚类算法主要是在全体样本的相似性度量的基础上进行聚类,因此对大规模数据进行聚类时,算法效率不高.基于此,设计了一种新的抽样策略,在此基础上,提出了一种基于抽样的大规模混合数据聚类集成算法.该算法对利用新的抽样策略得到的多个样本子集分别进行聚类,并将结果集成得到最终聚类结果.实验证明,与改进的K-prototypes算法相比,该算法的效率有了显著提高,同时聚类有效性指标基本相同.
聚类、大规模混合数据、聚类集成、抽样、有效性指标
43
TP391(计算技术、计算机技术)
国家自然科学“用户行为数据”稀疏表示的理论与方法研究61273294;山西省回国留学人员科研资助项目:基于多粒度与变粒度的群决策方法研究2013-101
2016-10-17(万方平台首次上网日期,不代表论文的发表时间)
共4页
209-212