10.19678/j.issn.1000-3428.0059920
基于异构图卷积网络的小样本短文本分类方法
针对小样本短文本分类过程中出现的语义稀疏与过拟合问题,在异构图卷积网络中利用双重注意力机制学习不同相邻节点的重要性和不同节点类型对当前节点的重要性,构建小样本短文本分类模型HGCN-RN.利用BTM主题模型在短文本数据集中提取主题信息,构造一个集成实体和主题信息的短文本异构信息网络,用于解决短文本语义稀疏问题.在此基础上,构造基于随机去邻法和双重注意力机制的异构图卷积网络,提取短文本异构信息网络中的语义信息,同时利用随机去邻法进行数据增强,用于缓解过拟合问题.在3个短文本数据集上的实验结果表明,与LSTM、Text GCN、HGAT等基准模型相比,该模型在每个类别只有10个标记样本的情况下仍能达到最优性能.
小样本短文本分类;异构图卷积网络;短文本异构信息网络;BTM主题模型;过拟合
47
TP391(计算技术、计算机技术)
国家自然科学基金;中国劳动关系学院中央高校基本科研业务费专项资金项目
2021-12-20(万方平台首次上网日期,不代表论文的发表时间)
共8页
87-94