用户查询意图的层次化识别方法
[目的]向搜索引擎提交的查询均有其潜在的查询意图,准确识别查询意图可以提高查询的效率.[方法]针对有明显意图的查询,采用滑动窗口寻找最大公共子串的策略抽取用户的意图模板,然后用模板匹配的方法识别用户查询意图.对无明显意图的查询,采用多特征融合的分类方法进行识别.[结果]实验结果表明,采用层次化识别方法和单独使用分类器方法相比,识别查询意图的实验结果正确率得到19.04%的提升.[局限]可获得的意图模板是有限的,因此显式意图查询的识别存在局限性.大规模数据情况下,模式匹配及机器学习算法的运算量很大,需要进一步优化算法.[结论]实验证明该方法在Web意图识别中是有效的,对意图识别率的提高有积极意义.
信息检索、查询意图、层次化识别、意图模板
TP391(计算技术、计算机技术)
国家自然科学基金项目“基于本体的专利自动标引研究”61271304;北京市教委科技发展计划重点项目暨北京市自然科学基金B类重点项目“面向领域的互联网多模态信息精准搜索方法研究”项目KZ201311232037的研究成果之一
2014-03-21(万方平台首次上网日期,不代表论文的发表时间)
共7页
36-42