DOI：10.11992/tis.202110038

面向超大规模数据的自适应谱聚类算法

引用

摘要：

针对超大规模数据聚类过程中人为设定邻域参数及计算量庞大等问题,提出了一种基于近似自然近邻的自适应超大规模谱聚类算法(approximate natural nearest neighbor based self-adaptive ultra-scalable spectral cluster-ing algorithm,AN3-SUSC).该算法首先通过混合代表选取缩小数据规模,在此基础上利用近似自然近邻自适应地确定局部邻域参数并构建相似矩阵,最后运用二部图进行迁移分割将数据空间映射到原超大规模数据空间中并完成谱聚类分析.超大规模数据集实验结果表明,该算法对超大规模数据集聚类效果有所提升,并且降低计算规模同时具有较高的鲁棒性和较强的自适应性.

关键词：数据聚类、超大规模、近似自然近邻、谱聚类、自然邻居、二部图、自适应、无参数

所属期刊栏目：18

分类号：TP311(计算技术、计算机技术)

资助基金：教育部人文社会科学研究项目;教育部人文社会科学研究项目;重庆市教委科学技术研究项目;重庆市研究生教育教学改革研究项目

在线出版日期：2023-04-20（万方平台首次上网日期，不代表论文的发表时间）

页数：共9页

页码：251-259

英文信息展示

期刊专题