10.19734/j.issn.1001-3695.2019.04.0132
基于双向长短时记忆单元和卷积神经网络的多语种文本分类方法
针对日渐丰富的多语种文本数据,为了实现对同一类别体系下不同语种的文本分类,充分发挥多语种文本信息的价值,提出一种结合双向长短时记忆单元和卷积神经网络的多语种文本分类模型BiLSTM-CNN模型.针对每个语种,利用双向长短时记忆神经网络提取文本特征,并引入卷积神经网络进行特征优化,获得各语种更深层次的文本表示,最后将各语种的文本表示级联输入到softmax函数预测类别.在中英朝科技文献平行数据集上进行了实验验证,结果表明,该方法相比于基准方法分类正确率提高了4%,且对任一语种文本均能正确分类,具有良好的扩展性.
多语种文本分类、长短时记忆单元、卷积神经网络
37
TP391.1(计算技术、计算机技术)
国家语委"十三五"科研规划项目;延边大学外国语言文学世界一流学科建设科研项目
2020-10-26(万方平台首次上网日期,不代表论文的发表时间)
共5页
2669-2673