一种基于WordNet和Corpus Statistics的语义相似性计算方法

引用

摘要：

提出一种新的基于WordNet和文本集语义参数IC的计算方法, 通过综合考虑概念在WordNet中语义信息以及数据集中的概率信息, 即概念的自信息, 同时利用新的参数考虑概念对在WordNet中的共享信息, 设计了一种通用的概念语义相似性计算方法, 该方法简化了传统语义相似性算法, 并解决了语义相似性计算领域的相关问题, 可以应用在信息抽取、信息检索、文档分类及本体学习中. 领域通用的数据集R&B数据实验结果表明, 该方法在计算语义相似度问题上有效.

关键词：语义相似性、布朗词集、IC模式

所属期刊栏目：48

分类号：TP391.1(计算技术、计算机技术)

资助基金：国家自然科学基金60673099,60873146;国家高技术研究发展计划863项目基金2009AA02Z307;吉林大学研究生创新基金20091022

在线出版日期：2010-11-02（万方平台首次上网日期，不代表论文的发表时间）

页数：共6页

页码：811-816

英文信息展示

期刊专题