10.3969/j.issn.1000-3428.2007.02.053
基于用户评价的查询串与搜索结果特征权重计算
提出了利用大量用户评价结果来进行特征权重的计算方法,用于解决搜索引擎中查询串与搜索结果的相似度分析.该方法完全利用用户对搜索结果的"潜在评价"来进行.用户对输入查询串所做的点击反映了其内部的关联性,该文提出的方法可获取这种关联性,对该问题建立了数学模型,利用EM算法解决了特征权重的计算.由于模型的函数比较复杂,难于计算其收敛性,因此,使用了模拟退火算法作为EM算法的补充,用于验证算法的收敛性.实验使用百度搜索引擎在竞价广告上进行,提取的测试数据样本为100个广告和144 132个query,获得的数据结果显示,所有特征收敛到全局最优解,抽样部分数据获得检索相似准确率为93.32%,召回率为87.43%.
网页排名、特征权重、EM算法、模拟退火算法
33
TP312(计算技术、计算机技术)
2007-03-12(万方平台首次上网日期,不代表论文的发表时间)
共3页
152-154