10.3969/j.issn.1000-1220.2002.01.031
Web日志挖掘中一种事务识别方法的改进
从web日志中发现有用的信息是所有web站点管理者的迫切愿望,但web服务器日志的不准确导致数据准备阶段的复杂性.在数据挖掘以往的应用领域如POS数据库中,存在着具有自然特征的事务,而在web日志中不但没有这种事务,而且还不容易通过分析得到这种事务.本文首先描述了引用长度事务分割方法的用户浏览行为模型,然后针对这种模型提出了两点改进:增加了网络延时参数和对噪音数据处理的考虑.改进后的模型能适应网络延时较大且随时间变化的情况,更能够反映用户的实际浏览行为.
数据挖掘、Web挖掘、事务识别
23
TP311(计算技术、计算机技术)
2004-01-08(万方平台首次上网日期,不代表论文的发表时间)
共3页
116-118