10.3969/j.issn.1003-0077.2006.z1.015
2005年863信息检索评测哈尔滨工业大学信息检索研究室技术报告
首先用向量空间模型工具Lucene从全部网页正文信息中检索,再用语言模型工具Lemur对结果集进行重排序,然后将两次的结果进行融合,返回融合结果的前1000篇文档作为最终结果集.构造查询输入时,从主题的<title>字段和<desc>字段选择关键词,并依据tf*idf的思想对关键词赋予权值.对正式评测的50个主题集检索,获得的三项评价指标为:程序自动构造查询时,MAP=0.3107,P@10=0.624,R-Precision=0.3672;人工构造查询时,MAP=0.3538,P@10=0.684,R-Precision=0.4078.
查询构造、向量空间模型、语言模型、结果融合
20
TP391(计算技术、计算机技术)
中国科学院资助项目60435020,60575042,60503072
2006-04-25(万方平台首次上网日期,不代表论文的发表时间)
共8页
83-90