10.19678/j.issn.1000-3428.0048357
基于路径与词林编码的词语相似度计算方法
现有词语相似度计算方法主要针对词语的路径结构进行计算,较少深入考虑词语的语义信息,导致计算结果不够准确.针对该问题,提出一种改进的词语语义相似度计算方法.将词语的词林编码与路径结构相结合,同时利用局部敏感哈希算法和海明距离计算词林编码之间的相似度.在MC和RG数据集上的实验结果表明,该方法可使皮尔逊相关系数分别达到0.897 4和0.866 8,较传统基于路径和深度的计算方法准确性更高.
同义词、路径结构、编码、词语相似度、局部敏感哈希算法、语义
44
TP391(计算技术、计算机技术)
2018-12-21(万方平台首次上网日期,不代表论文的发表时间)
共8页
160-167