基于统计机器翻译模型的查询扩展
在搜索引擎等实际的信息检索应用中,用户提交的查询请求通常都只包含很少的几个关键词,这会引起相关文档与用户查询之间的词不匹配问题,对检索性能有较严重的负面影响.该文在分析了查询产生模型的基础上,提出了一种新的基于统计机器翻译的查询扩展方法.通过统计机器翻译模型提取文档集中与查询词相关联的词,用以进行查询扩展.在TREC数据集上的试验结果表明:基于统计翻译的查询扩展方法不仅比不扩展的语言模型方法始终有12 %~17% 的提高,而且比流行的查询扩展方法-伪反馈也具有可比的平均准确率.
信息检索、查询扩展、语言模型、统计机器翻译
30
TP391(计算技术、计算机技术)
国家自然科学基金60435020;微软亚洲研究院项目
2008-05-20(万方平台首次上网日期,不代表论文的发表时间)
共5页
725-729