10.3969/j.issn.1003-0077.2008.06.017
机器学习的查询扩展在博客检索中的应用
该文介绍一种新的查询扩展方法,该方法结合了查询扩展技术和机器学习理论.通过机器学习的方法挑选出查询扩展词,以此提高检索结果的性能.对于输入的查询项,首先通过伪反馈技术生成候选扩展词集合,然后使用支持向量机对输入的候选词评分,挑选得分较高的候选词和原始查询项组成一个新的查询项.由于训练这个支持向量机的训练数据较难获得,我们利用评测会议的检索结果和检索工具自动地生成训练数据.这套查询扩展方法的优点在于通过对训练语料的学习,能够对候选扩展词作出更合理的选择.在TREC评测会议组织的观点检索任务中,相对于不采用任何扩展技术的基准系统,该方法提高了MAP指标33.1%.
计算机应用、中文信息处理、信息检索、查询扩展、机器学习
22
TP391(计算技术、计算机技术)
国家自然科学基金资助项目60673038,60503070
2009-02-16(万方平台首次上网日期,不代表论文的发表时间)
共6页
98-102,109