10.3969/j.issn.2095-2783.2013.10.010
一种基于约束的半监督聚类查询扩展方法
针对伪相关反馈模型反馈文档信息质量差和扩展词选择不适产生的漂移现象等问题,提出了一种基于约束的半监督聚类查询扩展方法.该方法对初检结果的前k个文档进行人工标注,分成相关文档与不相关文档两类;并利用一种半监督聚类算法对初检结果的前n个文档进行分析,提取出与查询相关的文档作为反馈文档.该方法通过对少量标注文档与查询相关性的学习,能够较准确地估计出大量未知文档与查询的相关性,提高反馈文档的质量,从而有效提高检索的查全率和查准率.实验结果表明,该方法比传统的伪相关反馈和基于无监督聚类的伪相关反馈有更优的检索性能.
信息检索、查询扩展、约束聚类、半监督聚类、伪相关反馈
8
TP391(计算技术、计算机技术)
国家自然科学基金资助项目61073041,61073043;黑龙江省自然科学基金资助项目F200901;高等学校博士学科点专项科研基金资助项目20112304110011,20122304110012
2013-12-04(万方平台首次上网日期,不代表论文的发表时间)
共4页
994-997