10.3969/j.issn.1008-0570.2009.21.074
基于访问路径的WEB事务聚类改进方法
聚类分析是Web日志挖掘系统的重要组件,聚类分析的质量决定挖掘结果的有效性.本文引入一种向量聚类方法,并针对原有方法的不足提出改进.首先分析用户事务求出用户事务的相似矩阵,通过分别计算用户事务相似度和用户浏览路径相似度,然后把两者平均得到不同用户事务之间的相似性系数,最后根据相似性系数方法得出聚类结果.这种算法考虑到了web用户访问的有序、连续、重复性,结果能够真正反映出用户的浏览兴趣.
日志挖掘、用户事务、聚类、相似性系数
25
TP393(计算技术、计算机技术)
2009-09-28(万方平台首次上网日期,不代表论文的发表时间)
共3页
184-185,121