10.19734/j.issn.1001-3695.2022.06.0285
基于多层子空间语义融合的深度文本聚类
针对传统深度文本聚类方法仅利用中间层的文本语义表示进行聚类,没有考虑到不同层次的神经网络学习到的不同文本语义表示以及中间层低维表示的特征稠密难以有效区分类簇的问题,提出一种基于多层次子空间语义融合的深度文本聚类(deep document clustering via muti-layer subspace semantic fusion,DCMSF)模型.该模型首先利用深度自编码器提取出文本不同层次的潜在语义表示;其次,设计一种多层子空间语义融合策略将不同层的语义表示非线性映射到不同子空间以得到融合语义,并用其进行聚类.另外,利用子空间聚类的自表示损失设计一种联合损失函数,用于监督模型参数更新.实验结果表明,DCMSF方法在性能上优于当前已有的多种主流深度文本聚类算法.
文本聚类、深度聚类、自编码器、语义表示
40
TP391.1(计算技术、计算机技术)
国家自然科学基金;国家自然科学基金;国家自然科学基金;贵州轻工职业技术学院院级课题资助项目
2023-01-16(万方平台首次上网日期,不代表论文的发表时间)
共6页
70-74,79