10.3969/j.issn.1009-4067.2014.07.038
WEB日志数据预处理
随着互联网的飞速发展,Web网站的数量越来越多,Web的用户量成倍增长.用户行为分析成了一个重要的课题.而基于Web日志的信息挖掘具有重要的意义,分析WEB日志是挖掘的首要步骤.本文旨在分析NCSA扩展日志格式(ECLF)的WEB日志文件,利用正则表达式,预先处理掉一些无用的信息,然后将所得的信息入库.为用户行为分析打下数据的基础.
Web日志、正则表达式、数据挖掘、用户行为
TP311(计算技术、计算机技术)
2014-05-27(万方平台首次上网日期,不代表论文的发表时间)
共1页
55