基于页面内容和站点结构的页面聚类挖掘算法
提出了结合站点拓扑结构和Web页面内容的页面聚类改进算法,改进算法引入Web页面的内容链接比和页组的组内链接度,并修改了频繁访问页组支持度的计算公式,以此来提高挖掘结果的兴趣性.通过实验数据的比较,改进算法较一般算法的收敛性好,发现的频繁访问页组的兴趣性高.
Web日志挖掘、日志分析、页面聚类、频繁访问页组
13
TP311(计算技术、计算机技术)
上海市科技发展基金985115035
2004-01-08(万方平台首次上网日期,不代表论文的发表时间)
共3页
467-469