DOI：10.3969/j.issn.1000-5846.2011.04.018

《知网》义原相似度计算的研究

引用

摘要：

词语之间相似度的计算广泛应用于信息检索、文本主题抽取、文本分类、机器翻译等研究领域.词语之间的相似度的计算通常有两方法,基于统计的方法和基于世界知识的方法.对于中文的词语相似度计算,有人提出一种利用《知网》计算词语相似度的方法,该方法通过计算《知网》义原的相似度进而计算词语的相似度,但是该方法在计算义原相似度时没有考虑义原在层次体系树上的深度以及区域密度.在此基础之上深入研究《知网》的义原层次体系,将义原在层次体系树上的深度和区域密度两个因素添加到义原相似度计算中.最后,实现了该计算方法并得到实验结果,将实验结果与改进前的计算方法的结果比较,发现考虑义原在层次体系树上的深度和区域密度得到的结果比不考虑这两个因素得到结果更符合实际.

关键词：知网、义原、相似度、自然语言处理

所属期刊栏目：38

分类号：TP391.1(计算技术、计算机技术)

在线出版日期：2012-05-25（万方平台首次上网日期，不代表论文的发表时间）

页数：共4页

页码：358-361

英文信息展示

期刊专题