10.11772/j.issn.1001-9081.2021060899
基于指针网络的抽取生成式摘要生成模型
作为自然语言处理中的热点问题,摘要生成具有重要的研究意义.基于Seq2Seq模型的生成式摘要模型取得了良好的效果,然而抽取式的方法具有挖掘有效特征并抽取文章重要句子的潜力,因此如何利用抽取式方法来改进生成式方法是一个较好的研究方向.鉴于此,提出了融合生成式和抽取式方法的模型.首先,使用TextRank算法并融合主题相似度来抽取文章中有重要意义的句子.然后,设计了融合抽取信息语义的基于Seq2Seq模型的生成式框架来实现摘要生成任务;同时,引入指针网络解决模型训练中的未登录词(OOV)问题.综合以上步骤得到最终摘要,并在CNN/Daily Mail数据集上进行验证.结果表明在ROUGE-1、ROUGE-2和ROUGE-L三个指标上所提模型比传统TextRank算法均有所提升,同时也验证了融合抽取式和生成式方法在摘要生成领域中的有效性.
抽取生成式摘要;TextRank算法;Seq2Seq模型;指针网络;语义融合
41
TP183(自动化基础理论)
国家自然科学基金面上项目61976247
2022-01-04(万方平台首次上网日期,不代表论文的发表时间)
共7页
3527-3533