DOI：10.3969/j.issn.1000-3428.2010.23.008

面向大规模数据集的近邻传播聚类

引用

摘要：

近邻传播聚类在计算过程中需构建相似度矩阵,该矩阵的规模随样本数急剧增长,限制了算法在大规模数据集上的直接应用.为此,提出一种改进的近邻传播聚类算法,利用数据点的局部分布,借鉴半监督聚类的思想构造稀疏化的相似度矩阵,并对聚类结果中的簇代表点再次或多次聚类,直至得到合适的簇划分.实验结果表明,该算法在处理能力和运算速度上优于原算法.

关键词：近邻传播聚类、大规模数据集、数据挖掘

所属期刊栏目：36

分类号：TP391(计算技术、计算机技术)

资助基金：国家自然科学基金资助项目70971067/G0112;江苏省高校自然科学基金资助项目09KJD520006;校级预研课题基金资助项目NSK2009/A04

在线出版日期：2011-03-14（万方平台首次上网日期，不代表论文的发表时间）

页数：共3页

页码：22-24

英文信息展示

期刊专题