基于用户查询日志的网络搜索主题分析
万方数据知识服务平台
应用市场
我的应用
会员HOT
万方期刊
×

点击收藏,不怕下次找不到~

@万方数据
会员HOT

期刊专题

10.11992/tis.201706096

基于用户查询日志的网络搜索主题分析

引用
网络搜索分析在优化搜索引擎方面具有举足轻重的作用,而且对用户个人搜索特性进行分析能够提高搜索引擎的精准度.目前,大多数已有模型(比如点击图模型及其变体),注重研究用户群体的共同特点.然而,关于如何做到既可以获取用户群体共同特点又可以获取用户个人特点方面的研究却非常少.本文研究了基于个人用户网络搜索分析新问题,即通过研究用户搜索的突发性现象,获取个人用户搜索查询的主题分布情况.提出了两个搜索主题模型,即搜索突发性模型(SBM)和耦合敏感搜索突发性模型(CS-SBM).SBM假设查询词和URL主题是无关的,CS-SBM假设查询词和URL之间是有主题关联的,得到的主题分布信息存储在偏Dirichlet先验中,采用Beta分布刻画用户搜索的时间特性.实验结果表明,每一个用户的网络搜索轨迹都有多种基于用户的独有特点.同时,在使用大量真实用户查询日志数据情况下,与LDA、DCMLDA、TOT相比,本文提出的模型具有明显的泛化性能优势,并且有效地描绘了用户搜索查询主题在时间上的变化过程.

网络搜索、搜索引擎、自然语言处理、主题模型、文本挖掘、突发性、时间分析、参数估计

12

TP391(计算技术、计算机技术)

国家自然科学基金重点项目U1201258;山东省自然科学杰出青年基金项目JQ201316;教育部人文社会科学研究项目15YJAZH042

2017-12-18(万方平台首次上网日期,不代表论文的发表时间)

共10页

668-677

相关文献
评论
暂无封面信息
查看本期封面目录

智能系统学报

1673-4785

23-1538/TP

12

2017,12(5)

相关作者
相关机构

专业内容知识聚合服务平台

国家重点研发计划“现代服务业共性关键技术研发及应用示范”重点专项“4.8专业内容知识聚合服务技术研发与创新服务示范”

国家重点研发计划资助 课题编号:2019YFB1406304
National Key R&D Program of China Grant No. 2019YFB1406304

©天津万方数据有限公司 津ICP备20003920号-1

信息网络传播视听节目许可证 许可证号:0108284

网络出版服务许可证:(总)网出证(京)字096号

违法和不良信息举报电话:4000115888    举报邮箱:problem@wanfangdata.com.cn

举报专区:https://www.12377.cn/

客服邮箱:op@wanfangdata.com.cn