10.3969/j.issn.1007-855X.2007.02.012
基于数据挖掘技术的网站用户分析
采用数据挖掘中的聚类技术,对微软网站日志文件中的用户行为数据进行分析,在用户行为的基础上将用户归为同质的组,从而寻求一种识别典型访问情况的方法.采用了一种"将SPRSQ减小的情况屏蔽,只考虑SPRSQ增加的情况"的处理方法,来实现最佳聚类个数K的选择.同时,在计算组内偏差的时候,提出了"冗余组内偏差"的概念.在聚类分析阶段完成之后,对每个聚类结果进行"标准化均值"比较,并对其用户行为作了简要分析.
聚类分析、层次聚类、网站日志
32
TP311(计算技术、计算机技术)
2007-06-04(万方平台首次上网日期,不代表论文的发表时间)
共4页
48-51