10.3969/j.issn.1000-3428.2009.07.016
Web日志预处理中优化的会话识别方法
针对Web日志数据预处理中会话识别这一重要环节,提出一种优化的会话识别算法.在用户识别后,通过过滤框架页面大幅度减少实验产生的有效页面数,为每个页面设置访问时间阈值,并根据页面重要程度对该阈值进行调整,页面的重要性由页面内容及站点结构确定.实验数据显示,与对所有页面使用单一的先验阈值进行会话识别的方法相比较,该方法得到了真实性更强的会话集.
Web挖掘、数据预处理、阈值、Frame 页面、会话识别
35
TP3;TN9
国家自然科学基金资助项目050504F;池州学院自然科学基金资助项目XK0829
2009-05-20(万方平台首次上网日期,不代表论文的发表时间)
共3页
49-51