10.3969/j.issn.1001-4160.2012.11.025
基于词汇链的多文档自动文摘研究
提出了一种基于词汇链抽取,文法分析的抽取文本代表词条的多文档摘要生成的方法.通过计算词义相似度构建词汇链,结合词频与位置特征进行文本代表词条成员的选择,将含有词条权值高的句子经过聚类形成多文档文摘句集合,然后进行质心句的抽取和排序,生成多文档文摘.该方法不仅考虑了词汇之间的语义信息,还考虑了词条对文本的代表成度,能够改善文摘句抽取的性能.实验结果表明,与单纯的由关键词确定文摘的方法相比,召回率和准确率都有不少的提高.
多文档文摘、词汇链、聚类、词条、词义相似度
29
TP391(计算技术、计算机技术)
宁夏大学科学研究基金资助项目ZR1122
2013-02-28(万方平台首次上网日期,不代表论文的发表时间)
共3页
1384-1386