10.3969/j.issn.1003-0077.2006.06.004
一种基于词汇链的关键词抽取方法
关键词在文献检索、自动文摘、文本聚类/分类等方面有十分重要的作用.词汇链是由一系列词义相关的词语组成,最初被用于分析文本的结构.本文提出了利用词汇链进行中文文本关键词自动标引的方法,并给出了利用<知网>为知识库构建词汇链的算法.通过计算词义相似度首先构建词汇链,然后结合词频与区域特征进行关键词选择.该方法考虑了词汇之间的语义信息,能够改善关键词标引的性能.实验结果表明,与单纯的词频、区域方法相比,召回率提高了7.78%,准确率提高了9.33%.
计算机应用、中文信息处理、关键词标引、关键词抽取、词汇链、词义相似度、知网
20
TP391(计算技术、计算机技术)
国家自然科学基金60503050
2006-12-07(万方平台首次上网日期,不代表论文的发表时间)
共6页
25-30