10.3321/j.issn:1001-0920.2007.03.009
一种新的Web用户群体和URL聚类算法的研究
提出一个基于Web日志的Web用户群体和站点URL聚类算法.使用用户浏览行为描述和用户浏览时间离散化方法建立了Web站点的用户事务矩阵,并在此基础上对Web用户群体和站点URL进行聚类.由于在聚类过程中同时考虑了用户对URL的浏览时间和访问次数,使算法的精度和效率都大大提高.同时,该算法能较好地处理类间重叠问题,使算法具有较好的实用性.最后对算法的有效性和可伸缩性进行了研究.
Web使用挖掘、用户浏览模式、用户访问矩阵、用户事务聚类、站点URL聚类
22
TP391.11(计算技术、计算机技术)
国家自然科学基金60173058
2007-04-19(万方平台首次上网日期,不代表论文的发表时间)
共5页
284-288