10.3969/j.issn.1003-0077.2008.06.009
以关键词抽取为核心的文摘句选择策略
针对面向查询的多文档自动文摘,该文提出了一种以关键词抽取为核心的文摘句选择策略.通过查询扩展的相关技术得到相关多文档集中词语的查询相关性特征,利用最大似然估计法得到语料中词语的话题相关性特征,并将这两个特征值进行特征融合得到词语的重要度以确定关键词.然后通过关键词的重要度来给候选句打分,进一步利用改进的MMR(Maximal Marginal Relevance)技术来调整候选句的得分,最后生成文摘.该文将特征融合引入到词语层面,在DUC2005的语料中测试取得了较好的效果.
计算机应用、中文信息处理、多文档文摘、关键词抽取、文摘句选择
22
TP391(计算技术、计算机技术)
国家自然科学基金资助项目60773167;湖北省自然科学基金资助项目2006ABC011;973国家重点基础研究发展计划资助项目2007CB310804;教育部/国家外国专家局高等学校学科创新引智计划资助项目B07042;国家"十一五"科技支撑计划课题资助项目2006BAK11B03
2009-02-16(万方平台首次上网日期,不代表论文的发表时间)
共5页
50-54