10.3969/j.issn.1000-7024.2014.05.052
搜索日志中领域查询串识别研究
利用搜索日志中查询串自身信息和用户点击信息,提出了双层模型识别领域查询串的方法.第一层模型采用贝叶斯法则和词典相结合的方法对查询串进行识别;针对搜索日志查询串内容简短、信息量少的特点,提出基于域名可信度的第二层识别模型.在搜狗2012版用户查询日志上对双层模型进行了开放测试,召回率和准确率分别达到了85.2%和94.6%,实验结果表明了该方法的有效性.
查询串、双层模型、贝叶斯、领域词典、域名可信度
35
TP391.1(计算技术、计算机技术)
国家自然科学基金项目61171159、61271304;北京市教委科技发展计划重点基金项目暨北京市自然科学基金B类重点基金项目KZ201311232037
2014-06-12(万方平台首次上网日期,不代表论文的发表时间)
共6页
1766-1771