10.3969/j.issn.1000-3428.2014.10.006
基于扩展查询表达式的XML关键字查询
目前可扩展标示语言( XML)关键字查询大多是基于最小公共祖先( LCA)语义子树产生查询结果,而未能加入除LCA语义子树之外与用户查询意图相关的结果。为解决该问题,提出一种基于扩展查询表达式的XML关键字查询方法。将用户查询日志作为查询扩展统计模型,对其进行统计分析,并结合最佳检索概念判断是否需要扩展查询表达式。使用XML TF-IDF方法计算候选属性的权重,根据初检结果的上下文信息,利用聚类方法获得与查询意图最相关的扩展查询关键字,从而扩展查询表达式。实验结果表明,与XSeek和基于语义词典的查询扩展方法相比,该方法的平均F度量值分别提高了7%和17%,具有较高的查询质量。
信息检索、可扩展标示语言、最小公共祖先语义、查询、查询扩展、上下文信息
TP391(计算技术、计算机技术)
国家自然科学基金资助项目60773075。
2014-10-31(万方平台首次上网日期,不代表论文的发表时间)
共7页
25-31