10.19734/j.issn.1001-3695.2019.02.0062
基于局部结构保留的级联子空间深度聚类
针对高维数据聚类的问题,许多有效的方法已经被提出,级联的子空间聚类算法CSC就是一种有效的解决法案.但是CSC算法定义的聚类损失可能破坏特征空间,从而取得非代表性的无意义特征,进而损害聚类性能.为了解决这一问题,提出了一种结合自编码器保留数据结构的改进算法.具体地说,使用聚类损失作为引导,分散特征空间数据点,同时采用一种欠完备的自动编码器作为重构损失,约束操作和维护数据生成分布的局部结构.将两者结合,共同优化聚类标签的分配,学习适合聚类的局部结构保留特征.使用自适应矩估计(Adam)和小批量随机梯度下降(mini-batch SGD)两种优化方法调整模型参数.在多个数据集上,使用聚类结果准确率(ACC)、标准互信息(NMI)和调整rand指数(ARI)三个评价指标验证了该算法的有效性和优越性.
高维数据聚类、自编码器、聚类损失、重构损失
37
TP391(计算技术、计算机技术)
国家自然科学基金资助项目;江西省自然科学基金资助项目
2020-10-14(万方平台首次上网日期,不代表论文的发表时间)
共4页
2358-2361