10.3969/j.issn.1000-3428.2010.23.024
基于闭合有间隔频繁子序列的点击流聚类
对网站日志文件中记录的点击流序列聚类可以发现用户使用模式,从而对用户归类.而传统聚类方法面临着难以提取点击流中有代表性的特征向量以及点击流及其特征向量存在数据稀疏性的问题.针对上述情况,提出一种基于闭合有间隔频繁子序列模式挖掘的点击流聚类方法.该方法从点击流中提取子序列模式的频繁支持度,构建特征向量,利用基于双向映射欧氏距离的模糊距离度量判断向量间相似度,增强BIRCH聚类算法对点击流数据的聚类效果.
点击流、聚类、频繁子序列模式、网络使用挖掘
36
TP311(计算技术、计算机技术)
2011-03-14(万方平台首次上网日期,不代表论文的发表时间)
共4页
72-75