10.3969/j.issn.1673-629X.2008.06.009
模糊C均值聚类算法在Web使用挖掘上的应用研究
Web日志中含有大量的用户浏览信息,从中将相似用户及相关页面进行聚类是建立自适应网站的必要前提.通过基本的预处理,实现了日志的数据净化、用户识别会话识别及数据规约,形成了用户访问页面的序列数据库,同时通过离散化技术计算出用户访问页面频度.在这些数据准备工作的基础上,构造了用户一页面关联矩阵,作为改进的模糊C均值聚类算法的输入,实现了相似用户及相关页面的聚类.实验表明改进的FCM算法的有效性.
模糊C均值聚类、Web日志预处理、关联矩阵、用户聚类、页面聚类
18
TP311(计算技术、计算机技术)
2008-07-23(万方平台首次上网日期,不代表论文的发表时间)
共4页
32-35