DOI：10.3969/j.issn.1003-0077.2005.02.014

一种新的句子相似度度量及其在文本自动摘要中的应用

引用

摘要：

本文提出了一种新的句子相似度度量的方法并应用于文本自动摘要中.其创新处在于相似度计算不仅考虑句子中的uni-gram,还考虑了bi-gram和tri-gram,通过回归方法将这几种相似度结果综合起来.实验证明这种相似度计算方法是有效的.同时本文还提出了一种新的,利用句子间相似度以及句子的权重的抽句式文摘算法,在抽取出句子的同时也去掉了冗余.DUC2003、DUC2004(Document Understanding Conference 2003,2004)的评测结果征明了方法的有效性.我们的系统在DUC2004的评测中列第二位.

关键词：计算机应用、中文信息处理、文本自动摘要、向量模型、相似度计算

所属期刊栏目：19

分类号：TP391(计算技术、计算机技术)

资助基金：国家自然科学基金60103014;上海市科委资助项目035005028

在线出版日期：2005-04-14（万方平台首次上网日期，不代表论文的发表时间）

页数：共7页

页码：93-99

英文信息展示

期刊专题