10.3778/j.issn.1673-9418.1603068
利用主题内容排序的伪相关反馈
传统的伪相关反馈(pseudo relevance feedback,PRF)方法,将文档作为基本抽取单元进行查询扩展,抽取粒度过大造成扩展源中噪音量的增加.研究利用主题分析技术来减轻扩展源的低质量现象.通过获取隐藏在伪相关文档集(pseudo-relevant set)各文档内容中的语义信息,并从中提取与用户查询相关的抽象主题内容作为基本抽取单元用于查询扩展.在NTCIR 8中文语料上,与传统PRF方法和基于主题模型的PRF方法相比较,实验结果表明该方法可以抽取出更符合用户查询的扩展词.此外,结果显示从更小的主题内容粒度出发进行查询扩展,可以有效提升检索性能.
主题模型、主题内容、伪相关反馈
11
TP391.3(计算技术、计算机技术)
The National Natural Science Foundation of China under Grant No.61263037;the Natural Science Foundation of Inner Mongolia under Grant Nos.2014BS0604,2014MS0603
2017-07-05(万方平台首次上网日期,不代表论文的发表时间)
共8页
814-821