10.3969/j.issn.1000-3428.2010.23.008
面向大规模数据集的近邻传播聚类
近邻传播聚类在计算过程中需构建相似度矩阵,该矩阵的规模随样本数急剧增长,限制了算法在大规模数据集上的直接应用.为此,提出一种改进的近邻传播聚类算法,利用数据点的局部分布,借鉴半监督聚类的思想构造稀疏化的相似度矩阵,并对聚类结果中的簇代表点再次或多次聚类,直至得到合适的簇划分.实验结果表明,该算法在处理能力和运算速度上优于原算法.
近邻传播聚类、大规模数据集、数据挖掘
36
TP391(计算技术、计算机技术)
国家自然科学基金资助项目70971067/G0112;江苏省高校自然科学基金资助项目09KJD520006;校级预研课题基金资助项目NSK2009/A04
2011-03-14(万方平台首次上网日期,不代表论文的发表时间)
共3页
22-24