10.19678/j.issn.1000-3428.0048715
基于VDCNN与LSTM混合模型的中文文本分类研究
自然语言在结构上存在一定的前后依赖性,且将中文文本直接转化为向量时会使维度过高,从而导致现有文本分类方法精度较低.为此,建立一种超深卷积神经网络(VDCNN)与长短期记忆网络(LSTM)相结合的混合模型.通过VDCNN的深度结构来提取文本向量的特征,利用LSTM具有存储历史信息的特点提取长文本的上下文依赖关系,同时引入词嵌入将文本转换为低维度向量.在Sogou语料库和复旦大学中文语料库上进行实验,结果表明,相对CNN+ rand、LSTM等模型,该混合模型可以有效提升文本分类的精确率.
文本分类、卷积神经网络、长短期记忆网络、词嵌入、深度残差网络
44
TP182(自动化基础理论)
河北省自然科学基金重点项目F2016202144;河北省自然科学基金面上项目F2017202145
2019-01-22(万方平台首次上网日期,不代表论文的发表时间)
共7页
190-196