10.3969/j.issn.1000-1220.2021.03.012
CGGA:一种CNN与并行门控机制混合的文本分类模型
针对中文文本分类准确率低、单一的卷积神经网络模型难以提取多方面特征的问题,本文提出一种基于CNN的并行门控机制的混合文本分类模型——CGGA(Convolutional Neural Network with parallel gating unit and attention mechanism).利用卷积提取文本的局部特征,并加入双向门控循环单元对数据进行上下文数据建模,提取关系特征,同时,引入门控Tanh-ReLU单元进行进一步的特征筛选,从而控制信息向下层流动的力度,并且减轻梯度弥散,提高模型分类准确率.最后,使用多头注意力机制进行权重更新计算,以提高在相应文本类别上的输出,进而优化模型分类性能.实验结果显示,本文提出的文本分类模型和分类算法,在THUCNews数据集和搜狐数据集上,比基线模型的宏平均精确率分别提高了2.24%、6.78%.
卷积神经网络、门控Tanh-ReLU单元、双向门控循环单元、多头注意力机制、文本分类
42
TP391(计算技术、计算机技术)
科技部重点研发计划项目;郑州大学青年骨干教师培养计划项目
2021-03-29(万方平台首次上网日期,不代表论文的发表时间)
共6页
516-521