基于多任务学习的生成文本摘要研究

引用

摘要：

基于注意力机制的编码-解码模型的神经网络具有很好的生成文本摘要能力.但是,这些模型在生成过程中很难控制,这导致在生成文本中缺少关键信息.一些关键信息,例如时间,地点和人物,对于人类理解主要内容是必不可少的.本文提出了一个基于多任务学习框架的用于生成文本摘要的关键信息指南网络.主要思想是以端到端的方式自动提取人们最需要的关键信息,并用其指导生成过程,从而获得更符合人类需求的摘要.在本文提出的模型中,文档被编码为两个部分:普通文档编码器的编码结果和关键信息的编码,关键信息包括关键句和关键词.引入了多任务学习框架以获得更先进的端到端模型.为了融合关键信息,提出了一种多视角注意指南网络,以获取源文本和关键信息的向量.另外,向量被合并到生成模块中以指导摘要生成的过程.本文在CNN与Daily Mail数据集上评估了模型,实验结果表明此模型有重大改进.

关键词：关键信息、多任务学习、文本摘要、关键信息指南网络

所属期刊栏目：16

分类号：TP391.1(计算技术、计算机技术)

在线出版日期：2020-12-21（万方平台首次上网日期，不代表论文的发表时间）

页数：共7页

页码：20-25,48

英文信息展示

期刊专题