混合语义模型的产品知识文档检索

引用

摘要：

为解决产品知识文档检索过程中遇到的问题,提出一种基于混合语义模型的检索方法.该方法将传统的用户查询需求扩展为用户偏好、语境和用户查询混合而成的语义集合,并对知识文档和用户需求进行基于本体的模糊概念表达.对于知识文档,选择领域本体的叶节点来构造文本概念向量,根据概念在本体图中的深度、携带的信息量,及出现在文档与语料库中的频度来计算权重.同样采用本体表达知识语境与查询语义,建立用户偏好模型.针对检索模型的不同组成,阐述了相应的相似度计算方法,采用概念的语义距离计算用户当前语境和文档语境之间的相似度,用余弦法计算查询语义、用户偏好与文档的相似度.最后用实验验证了该方法的检索效果优于传统的向量空间方法.

关键词：信息检索、本体、语义、向量

所属期刊栏目：31

分类号：TP391;TP182(计算技术、计算机技术)

资助基金：国家自然科学基金资助项目50475156;新世纪优秀人才支持计划资助项目NCET-05-0285

在线出版日期：2009-01-13（万方平台首次上网日期，不代表论文的发表时间）

页数：共7页

页码：1198-1203,1208

英文信息展示

期刊专题