10.3969/j.issn.1001-6600.2009.01.037
基于语义联系的新闻网页关键词抽取
提出一种基于语义联系的新闻网页度,还考虑词语在具体上下文中的相关性,用词汇链将词语语义联系表示成图形式,在此基础上抽取出新闻网页关键词.对从网易网站选取120篇有核心提示的新闻网页进行测试,实验结果表明,所提出的方法比基于词频的关键词抽取方法和基于<知网>语义相似度构建词汇链的关键词抽取方法,在准确率和召回率上有很大的提高,当抽取关键词个数为3时,比基于词频方法的准确率和召回率分别提高了27.77%和21.38%.
关键词抽取、词汇链、语义联系
27
TP391(计算技术、计算机技术)
国家自然科学基金资助项目60573174;中国科学院自动化研究所开放课题"HTML新闻网页过滤与总结系统"资助
2009-05-20(万方平台首次上网日期,不代表论文的发表时间)
共4页
145-148