10.3969/j.issn.1001-6600.2007.02.034
基于同义词词林的中文文本主题词提取
中文文本主题词的提取可以浓缩一篇文章,可以提炼一个中文网页,还可以帮助实现网上广告与网页的精确匹配.提出了一种基于同义词词林的中文文本主题词提取方法,不仅考虑了传统的影响主题词语权重的因素,还考虑到了同义词、相关词以及下位词的出现对于词语权重的影响.实验表明,用该方法对中文文本进行主题词提取,准确率可达83.25%.
主题词提取、同义词词林、权值、同义词
25
TP391(计算技术、计算机技术)
国家自然科学基金60272084;北京市教委科技发展计划项目KZ200310772013;北京市科委科研项目KM200510772008;KM200610772008
2007-07-02(万方平台首次上网日期,不代表论文的发表时间)
共4页
145-148