10.3321/j.issn:0253-987X.2009.08.002
具有孤立项过滤的信息检索查询词的分析方法
针对传统查询词临近性(QTP)分析方法无法有效提高查准率的问题,提出了一种孤立项过滤的信息检索查询词分析方法.该方法根据词汇相似度较高的查询词对之间具有强可替代性这一事实,从查询词及其实例中分解出查询内的孤立项和文档内的孤立项,在分析查询词临近性之前预先进行孤立项过滤,使之不参与QTP统计量的计算,由此减小了过分强调临近性对查准率的影响.实验结果表明,对于词汇相似度差异比较显著的查询,进行孤立项过滤的查询词临近性分析方法的平均检索精确度比传统分析方法提高14%.
信息检索、查询词临近性、孤立项、词汇相似度
43
TP391(计算技术、计算机技术)
教育部高等学校博士学科点专项科研基金资助项目20060698018;国家高技术研究发展计划资助项目2006AA01Z101
2009-09-28(万方平台首次上网日期,不代表论文的发表时间)
共6页
6-10,63