10.16208/j.issn1000-7024.2021.09.038
基于双编码器的中文文本摘要技术的研究与实现
针对自然语言处理领域生成式文本摘要任务中存在的语义编码不充分、摘要语句不通顺问题,提出一种基于序列到序列(Seq2Seq)结构的生成式摘要模型TCAtten-GRU.采用双编码器对源文信息进行充分编码,应用时间卷积网络(TCN)获取全文的语义信息,卷积神经网络(CNN)提取文本的高层特征.解码器采用结合指针机制和集束搜索的门控循环单元(GRU)解决生成摘要不通顺问题.中文短文本摘要数据集LCSTS的实验结果表明,该模型与RNN、RNN con-tent、MC-LSTM+atten和BiGRU-GRU+atten这4个模型对比,ROUGE-1提高了0.037-0.155,ROUGE-2提高了0.075-0.156,ROUG E-L提高了0.035-0.157,验证了该模型可以有效提升摘要质量.
生成式自动摘要、序列到序列模型、时间卷积网络、卷积神经网络、注意力机制
42
TP391.1(计算技术、计算机技术)
辽宁省教育厅科学技术研究基金项目;辽宁省教育厅科学研究基金项目;辽宁省博士启动基金项目
2021-09-22(万方平台首次上网日期,不代表论文的发表时间)
共9页
2687-2695