DOI：10.3969/j.issn.1673-629X.2014.12.009

多特征结合的词语相似度计算模型

引用

摘要：

词语相似度计算在基于实例的机器翻译、信息检索、自动问答系统等有着广泛的应用。词语相似度的计算一般都是在基于《知网》的义原的基础上，通过计算概念之间的相似度来获取。文中在综合考虑义原距离、义原深度、义原宽度、义原密度和义原重合度的基础上，利用多特征结合的方法计算词语相似度。为了验证算法的合理性，利用Miller和Charles文献给出的基准词作为测试集合，将计算得到的词语相似度的值与专家值进行比较，计算其皮尔逊相关系数，计算结果达到了0.852。实验结果表明多特征结合的词语相似度计算和专家评定的词语相似度计算非常吻合。

关键词：词语相似度、知网、同义词词林、语义距离

分类号：TP391.1(计算技术、计算机技术)

资助基金：中央高校基本科研业务费专项资金13CX02031A

在线出版日期：2015-01-22（万方平台首次上网日期，不代表论文的发表时间）

页数：共4页

页码：37-40

英文信息展示

期刊专题