基于隐主题马尔科夫模型的多特征自动文摘
基于隐主题马尔科夫模型,消除LDA主题模型的主题独立假设,使得文摘生成过程中充分利用文章的结构信息,并结合基于内容的多特征方法提高文摘质量.提出在不破坏文章结构的前提下,从单文档扩展到多文档的自动文摘策略,最终搭建完善的自动文摘系统.在DUC2007标准数据集上的实验证明了隐主题马尔科夫模型和文档特征的优越性,所实现的自动文摘系统ROUGE值有明显提高.
隐主题马尔科夫模型、多特征、多文档自动文摘
50
TP391(计算技术、计算机技术)
国家自然科学基金61370130;科技部国际科技合作计划K11F100010;中央高校基本科研业务费专项资金2010JBZ2007;中国科学院计算技术研究所智能信息处理重点实验室开放课题IIP2010-4;北京交通大学人才基金2011RC034
2017-01-18(万方平台首次上网日期,不代表论文的发表时间)
共7页
187-193