10.3969/j.issn.1673-629X.2011.01.012
Web日志挖掘数据预处理优化
在web日志挖掘中,数据预处理技术是各项工作的基础,此项内容将直接影响到后面的各个阶段,因此,也就显得至关重要.在已有的预处理方法基础上,选用了一种建立用户访问树的方法对用户进行识别,并且可以在缺乏网站拓扑结构的情况下对日志进行处理.提出了一种改进的事务处理方法,这可以在不额外增加步骤的基础上,能直接去除无用的事务,从而减少预处理结果对数据挖掘的影响,使得到的事务能更好地应用到模式分析当中,大大增强了后期挖掘的正确性.
数据预处理、Web日志、用户识别、事务识别
21
TP311(计算技术、计算机技术)
安徽省教育科研重点项目KJ2009A57
2011-05-30(万方平台首次上网日期,不代表论文的发表时间)
共4页
42-45