10.3969/j.issn.1001-3695.2011.01.028
基于语义关联的中文网页主题词提取方法研究
提出了一种基于语义关联的中文网页主题词提取方法,首先借助滑动窗口和"知网"计算词语间的语义相似度,形成候选名词对集合;然后基于该集合生成无向图表示词语间的语义联系,并通过该无向图对主题词权重进行建模;最后选取权值较高的名词作为主题词.实验结果表明,相比未建立语义关联的主题词提取方法,本方法在查准率、召回率和F1测度值上均有一定的提高,当提取主题词个数为7时,本方法召回率和F1测度值达到最大值,且分别较传统方法最大值提高了12.5%和9.53%.
语义关联、中文网页、主题词、权重
28
TP301.6(计算技术、计算机技术)
国家自然科学基金资助项目60903225;湖北省自然科学基金资助项目2008CDB388
2011-04-27(万方平台首次上网日期,不代表论文的发表时间)
共4页
105-107,123