10.3778/j.issn.1673-9418.2007010
基于集成学习的改进深度嵌入聚类算法
近年来深度学习的迅速发展为聚类研究提供了一个有力的工具,并衍生出了许多基于深度神经网络的聚类方法.在这些方法中,深度嵌入聚类(DEC)因其可对深度表示学习和聚类分配同时进行优化的优势而日益受到关注.但是,深度嵌入聚类的一个局限性在于其超参数λ的敏感性,而往往需要诉诸人工调节来解决.对此,提出一种基于集成学习的改进深度嵌入聚类(IDECEL)方法.相较于寻求单个最优超参数的常规做法,提出以多样化超参数λ构建一组具有差异性的基聚类,并结合熵理论对基聚类集合的簇不确定性进行评估与加权,进而在簇与样本之间构建一个局部加权二部图模型,再将之高效划分以得到一个更优聚类结果.在多个数据集上的实验结果表明,提出的IDECEL方法不仅可缓解常规DEC算法超参数敏感性的问题,同时也表现出比其他多个深度聚类和集成聚类方法更为鲁棒的聚类性能.
数据聚类;深度聚类;集成聚类;集成学习;敏感超参数
15
TP391.4(计算技术、计算机技术)
国家自然科学基金;广东省自然科学基金;广州市智慧农业重点实验室项目
2021-10-18(万方平台首次上网日期,不代表论文的发表时间)
共9页
1949-1957