10.3969/j.issn.1003-0077.2011.01.006
基于群体智慧的Web访问日志会话主题识别研究
Web访问日志中的会话(session)是指特定用户在一定时间范围内的访问行为的连续序列.会话主题(topic)是指会话中具有相同用户意图的部分.从会话中进一步识别出能体现用户意图的处理单元(topic)是进行用户访问行为分析的重要基础.目前相关工作主要集中在边界识别上,无法处理用户意图交叉情况.为了解决该问题,该文重新形式化定义了session和topic的相关概念,提出最大划分的求解任务,并设计出了基于用户群体智慧的会话主题识别算法.在使用大规模真实Web访问日志的实验中,我们的算法取得了不错的效果.
会话主题识别、Web访问日志
25
TP391(计算技术、计算机技术)
自然科学基金资助项目60736044,60903107;高等学校博士学科点专项科研基金资助项目20090002120005
2011-06-03(万方平台首次上网日期,不代表论文的发表时间)
共6页
35-40