10.3969/j.issn.1003-0077.2012.02.017
面向冗余度控制的中文多文档自动文摘
多文档自动文摘能够帮助人们自动、快速地获取信息,是目前的一个研究热点.相比于单文档自动文摘,多文档自动文摘需要更多考虑文档之间的相关性,以及文档信息之间的冗余性.因此如何控制信息冗余是多文档自动文摘的一个关键所在.该文在考虑文摘特性的基础上提出了一个冗余度控制模型,该模型通过计算文本单元在主题概率分布之间的相似度来决定句子的选择,从而达到控制冗余的目的.实验结果表明,该方法能够有效降低冗余度,且总体性能优于现有的自动文摘系统.
冗余度控制、多文档自动文摘、中文自动文摘
26
TP391(计算技术、计算机技术)
国家自然科学基金资助项目60873150,60970056;江苏省高校自然科学基金资助项目10KJB520016
2012-05-25(万方平台首次上网日期,不代表论文的发表时间)
共5页
92-96