10.3778/j.issn.1002-8331.2011.23.004
限定语义距离的关键词同义扩展及精简
针对现存的单纯借助同义词词林或知识词典扩展关键词方法中存在噪音数据和计算量大的问题,提出了先扩展后精简的方法,即先利用同义词词林进行同义扩展,再利用知网义原树计算扩展词之间的语义距离,依据语义距离剔除相似度较小的噪音数据,实现关键词集合的精简.实验表明,当词语相似度阈值取0.8时,精简比例高达46.9%,精简后的关键词集合有效剔除了噪音数据,兼顾了信息检索的召回率和准确率,表现出良好的综合性能.
汉语问答系统、关键词扩展、义原树、关键词集合精简
47
TP311(计算技术、计算机技术)
国家自然科学基金the National Natural Science Foundation of China under Grant 60970059;山西省国际科技合作计划项目2009081022
2012-01-14(万方平台首次上网日期,不代表论文的发表时间)
共5页
13-16,24