10.3969/j.issn.1673-4807.2012.01.017
Web日志挖掘中的数据预处理研究
Web日志挖掘中,数据源(日志文件)的复杂性是挖掘所面临的主要问题之一.针对Web日志挖掘的数据预处理问题,全面梳理了数据预处理的全过程.针对日志文件数据量巨大的难题,使用Python语言程序高效的实现了数据清理.在用户识别、会话识别和路径完善中,在传统方法的基础上引入了启发性规则,通过实验数据验证了方法的有效性.
Web挖掘、Web日志挖掘、数据预处理
26
TP391(计算技术、计算机技术)
2012-07-23(万方平台首次上网日期,不代表论文的发表时间)
共5页
81-85