10.3969/j.issn.1672-9722.2021.07.019
基于改进的CBOW与BI-LSTM-ATT的文本分类研究
特征词的选取与文本表示是文本分类信息预处理的核心问题之一,鉴于此,论文提出一种改进的加权连续词袋模型(CBOW)与基于注意力机制的双向长短期记忆网络模型(BI-LASM-ATT)应用于文本分类研究.该模型以词频作为特征选择依据,改进了频次与反频次,利用加权CBOW模型得到词向量表示,作为BI-LSTM-ATT模型的词嵌入层,得到Soft-max分类器分类结果.论文在复旦大学提供的语料集的实验结果表明,该模型在文本分类的精确率、召回率、F_meature效果对比中,比传统机器学习和深度学习算法均有明显提高.
深度学习;CBOW;LSTM;注意机制;文本分类
49
TP391.1(计算技术、计算机技术)
国家自然科学基金项目;黑龙江省自然科学基金项目;东北石油大学引导性创新基金项目
2021-08-10(万方平台首次上网日期,不代表论文的发表时间)
共5页
1372-1376