10.3969/j.issn.1673-629X.2012.04.012
Web日志挖掘中的会话识别方法研究
数据预处理是Web日志挖掘的首要环节,而会话识别是数据预处理中的关键步骤之一.为了更好地实现会话识别、提高会话识别的真实度,从而为后续的模式挖掘工作提供精确的挖掘数据,文中在分析了现有常用的会话识别方法后,提出了优化初始会话集的方法.在该方法中,首先初始会话集的产生采用传统的基于访问时间的方法,然后对初始会话集进行合并和断开操作,生成优化的会话集.最后,采用实验实现了该方法.实验结果表明会话质量得到了提高.
Web日志挖掘、数据预处理、会话识别、会话重组、访问时间
22
TP31(计算技术、计算机技术)
中国民航局科研基金项目MHRD200808
2012-06-26(万方平台首次上网日期,不代表论文的发表时间)
共5页
45-49