一种基于WordNet和Corpus Statistics的语义相似性计算方法
提出一种新的基于WordNet和文本集语义参数IC的计算方法, 通过综合考虑概念在WordNet中语义信息以及数据集中的概率信息, 即概念的自信息, 同时利用新的参数考虑概念对在WordNet中的共享信息, 设计了一种通用的概念语义相似性计算方法, 该方法简化了传统语义相似性算法, 并解决了语义相似性计算领域的相关问题, 可以应用在信息抽取、信息检索、文档分类及本体学习中. 领域通用的数据集R&B数据实验结果表明, 该方法在计算语义相似度问题上有效.
语义相似性、布朗词集、IC模式
48
TP391.1(计算技术、计算机技术)
国家自然科学基金60673099,60873146;国家高技术研究发展计划863项目基金2009AA02Z307;吉林大学研究生创新基金20091022
2010-11-02(万方平台首次上网日期,不代表论文的发表时间)
共6页
811-816