基于BiLSTM-CNN模型的新闻文本分类

引用

摘要：

针对单一CNN网络在新闻文本分类中容易忽略上下文的语义信息,分类准确率低的问题,同时结合CNN和BiLSTM的优点,提出一种基于BiLSTM-CNN模型的新闻文本方法.该模型先使用Word2Vec中的Skip-gram模型对数据中的词进行映射处理,转换为固定维度的向量;再利用BiLSTM捕捉双向的语义信息;最后将BiLSTM模型提取的特征与词嵌入的特征进行拼接作为CNN的输入,使用大小为2,3,4的卷积核进行卷积.在THUCNews和SougouCS两个公开的数据集上进行实验,实验结果表明,融合的BiLSTM-CNN模型在新闻文本分类效果上优于BiLSTM、CNN模型.

关键词：文本分类;CNN;BiLSTM;Word2Vec

所属期刊栏目：17

分类号：TP391.1(计算技术、计算机技术)

在线出版日期：2021-08-19（万方平台首次上网日期，不代表论文的发表时间）

页数：共3页

页码：105-107

英文信息展示

期刊专题