10.11896/j.issn.1002-137X.2015.6.004
基于分类模型的查询扩展方法
查询扩展作为查询优化的重要组成部分,对改善信息检索系统的性能起到了至关重要的作用.传统的伪相关反馈查询扩展方法虽然在一定程度上提高了检索性能,但选择的扩展词中会包含一部分与原查询不相关的词语,这对检索性能的提升产生了不利影响.提出了一种基于分类模型的查询扩展方法,该算法综合候选扩展词的统计信息和多种特征,采用朴素贝叶斯分类模型对初次得到的候选扩展词进行再次分类选择,进一步去除与查询词相关性小的扩展词.在TREC 2013数据集上的实验结果表明,提出的查询扩展方法能够有效提高用户查询的查准率和查全率.
查询扩展、分类模型、信息检索、伪相关反馈
42
TP391(计算技术、计算机技术)
中国科学院自动化研究所复杂系统管理与控制国家重点实验室开放课题99S9021F4D;国家自然科学基金61472034;教育部新世纪优秀人才支持计划NCET-13-0041;北京理工大学基础研究基金
2015-07-06(万方平台首次上网日期,不代表论文的发表时间)
共5页
18-22