基于局部主题判定与抽取的多文档文摘技术
提出了一个通过对同一主题的多文档集合内局部主题的判定和抽取生成多文档文摘的方法.首先在对多文档集合中句子依存分析和语义分析的基础上进行相似度计算,将相似句子经过聚类形成多文档集合内不同的局部主题,然后进行每个局部主题中质心句的抽取和排序,生成多文档文摘.该方法实现了文摘长度随文档内容自动确定,从而保证了文摘中包含的信息的全面和简洁.最后文中还给出了多文档文摘的评价方法和实验结果,文摘的平均精确率和平均压缩率分别为71.4%和25.2%.
多文档文摘、局部主题、聚类
30
TP391(计算技术、计算机技术)
国家自然科学基金60203020;国家高技术研究发展计划863计划2001AA114041
2004-12-16(万方平台首次上网日期,不代表论文的发表时间)
共6页
905-910