基于VDCNN与LSTM混合模型的中文文本分类研究

引用

摘要：

自然语言在结构上存在一定的前后依赖性,且将中文文本直接转化为向量时会使维度过高,从而导致现有文本分类方法精度较低.为此,建立一种超深卷积神经网络(VDCNN)与长短期记忆网络(LSTM)相结合的混合模型.通过VDCNN的深度结构来提取文本向量的特征,利用LSTM具有存储历史信息的特点提取长文本的上下文依赖关系,同时引入词嵌入将文本转换为低维度向量.在Sogou语料库和复旦大学中文语料库上进行实验,结果表明,相对CNN+ rand、LSTM等模型,该混合模型可以有效提升文本分类的精确率.

关键词：文本分类、卷积神经网络、长短期记忆网络、词嵌入、深度残差网络

所属期刊栏目：44

分类号：TP182(自动化基础理论)

资助基金：河北省自然科学基金重点项目F2016202144;河北省自然科学基金面上项目F2017202145

在线出版日期：2019-01-22（万方平台首次上网日期，不代表论文的发表时间）

页数：共7页

页码：190-196

英文信息展示

期刊专题