基于BiLSTM-CNN模型的新闻文本分类
针对单一CNN网络在新闻文本分类中容易忽略上下文的语义信息,分类准确率低的问题,同时结合CNN和BiLSTM的优点,提出一种基于BiLSTM-CNN模型的新闻文本方法.该模型先使用Word2Vec中的Skip-gram模型对数据中的词进行映射处理,转换为固定维度的向量;再利用BiLSTM捕捉双向的语义信息;最后将BiLSTM模型提取的特征与词嵌入的特征进行拼接作为CNN的输入,使用大小为2,3,4的卷积核进行卷积.在THUCNews和SougouCS两个公开的数据集上进行实验,实验结果表明,融合的BiLSTM-CNN模型在新闻文本分类效果上优于BiLSTM、CNN模型.
文本分类;CNN;BiLSTM;Word2Vec
17
TP391.1(计算技术、计算机技术)
2021-08-19(万方平台首次上网日期,不代表论文的发表时间)
共3页
105-107