DOI：10.16208/j.issn1000-7024.2017.02.029

基于访问行为序列相似度的加权聚类算法

引用

摘要：

传统算法很少有研究用户行为的聚类,用户访问关键词、访问时间、访问次数等行为都能够反应出其兴趣,从用户行为日志出发,考虑到其访问量、关键词序列以及关键词之间的时间间隔权重,对k-means进行改进,提出一种基于行为序列相似度的加权聚类算法K-Similar,重要的用户群体聚到一类,挖掘出这一类用户的内容需求.该算法已在中国知网的行为日志数据上进行了验证,验证结果表明,该算法在效率和精度上较k-means都有一定程度的提高,得到了兴趣度更高的用户群体,展现了群体的需求特点.

关键词：加权聚类、用户访问行为、访问量、关键词序列、时间间隔、序列相似度

所属期刊栏目：38

分类号：TP182(自动化基础理论)

资助基金："十二五"国家科技支撑计划基金项目2013BAH47F02

在线出版日期：2017-03-15（万方平台首次上网日期，不代表论文的发表时间）

页数：共7页

页码：430-436

英文信息展示

期刊专题