10.3969/j.issn.1000-3428.2015.09.040
基于2008版《知网》的词语相似度计算方法
词语相似度的计算是自然语言处理领域的重要问题,在机器翻译、信息检索、文本分类等领域有广泛的应用.分析和利用新版语义词典2008版《知网》,从概念的主类义原和概念的特征描述2个方面综合计算词语相似度.运用义原树的树形层次结构,得到义原的深度信息量,再考虑义原的路径计算得到义原相似度.通过层次特征类型匹配计算概念特征描述的相似度.综合主类义原相似度、概念特征描述相似度以及义原之间的对义、反义关系计算得到词语相似度.实验结果表明,该方法得到的词语相似度计算结果与人的主观认识趋于一致.
词语相似度、2008版《知网》、义原、深度信息量、路径、特征描述
41
TP391(计算技术、计算机技术)
国家自然科学基金资助项目61363014,71171148;江西省自然科学基金资助项目20151BAB207016
2015-11-06(万方平台首次上网日期,不代表论文的发表时间)
共5页
215-219