10.3772/j.issn.1000-0135.2012.10.006
一种基于引用上下文和引文网络的相关反馈算法
相关反馈是一种根据用户或系统的相关性判断重构初始检索提问的方法,已被证明可以有效地改进检索效果.具体到学术文献,其引用关系表征了文献内容上的相关性,因而可以为相关反馈提供有价值的辅助信息.本文提出了一种基于引用上下文、文献同被引和文献耦合的相关反馈改进算法.该算法的基本思想包括:利用学术文献的引用上下文信息扩充词包模型(bags of words)进行文本表示;在相关文献判断阶段利用相关文献在引文网络中与其他文献的同被引强度和耦合强度扩充相关文献集合;结合基于聚类的相关反馈思想抽取查询扩展项.实验证明该算法提高了相关反馈效果.此外,相关分析的结果表明文献同被引以及文献耦合强度与文献内容相似度具有显著的相关性.
相关反馈、引用上下文、同被引、文献耦合、聚类
31
TP3;TP7
国家社科基金项目"中文学术信息检索系统相关性集成研究"项目批准号10CTQ027;教育部人文社会科学研究规划基金项目"面向用户的相关性标准及其应用研究"项目批准号07JA870006;中国科学技术信息研究所合作研究项目的资助
2012-12-26(万方平台首次上网日期,不代表论文的发表时间)
共10页
1052-1061