DOI：10.3969/j.issn.1003-0077.2018.06.009

TP-AS:一种面向长文本的两阶段自动摘要方法

引用

摘要：

随着互联网上信息的爆炸式增长,如何有效提高知识获取效率变得尤为重要.文本自动摘要技术通过对信息的压缩和精炼,为知识的快速获取提供了很好的辅助手段.现有的文本自动摘要方法在处理长文本的过程中,存在准确率低的问题,无法达到令用户满意的性能效果.为此,该文提出一种新的两阶段的长文本自动摘要方法T P-AS ,首先利用基于图模型的混合文本相似度计算方法进行关键句抽取,然后结合指针机制和注意力机制构建一种基于循环神经网络的编码器—解码器模型进行摘要生成.通过基于真实大规模金融领域长文本数据上的实验,验证了TP-AS方法的有效性,其自动摘要的准确性在ROUGE-1的指标下分别达到了36 .6%(词)和33 .9%(字符),明显优于现有其他方法.

关键词：自动文本摘要、自然语言处理、抽取和生成、循环神经网络

所属期刊栏目：32

分类号：TP391(计算技术、计算机技术)

资助基金：国家自然科学基金61402494,61402498,71690233;湖南省自然科学基金2015JJ4009

在线出版日期：2018-08-15（万方平台首次上网日期，不代表论文的发表时间）

页数：共9页

页码：71-79

英文信息展示

期刊专题