一种基于抽样改进加权核K-means的大数据谱聚类算法
经典谱聚类将数据聚类转化为加权图划分问题,在分析Normalized Cut目标函数与加权核K-means函数等价基础上,设计了一种基于抽样改迸加权核K-means算法的大规模数据谱聚类算法.算法通过Leaders迸行初始聚类预处理,以控制后续随机抽样的数据规模及对原始数据类别的覆盖,通过抽样子集内加权核K-means迭代优化,避免Laplacian矩阵特征分解的大量资源占用,从而以部分核矩阵的使用避免全部核矩的时间、空间复杂度.试验结果表明,改迸算法在保持与经典算法相近聚类精度基础上,大幅提高了聚类效率.
大规模数据集谱聚类、加权核K-means算法、数据抽样、核矩阵
P208(一般性问题)
国家自然科学基金61501337;深圳职业技术学院校级基金课题601522S25007
2018-12-25(万方平台首次上网日期,不代表论文的发表时间)
共5页
78-82