10.3969/j.issn.1003-3254.2011.05.051
基于属性重要性的WUM数据预处理方式
为了降低Web日志数据的规模,并能从预处理后的数据中发现更有价值的访问模式,在引入知识的信息量的基础上,给出了单个属性相对于属性集的重要性量化值的概念,并采用了操作系统中LRU页面置换算法的思想,提出了基于属性重要性的WUM数据预处理方式.实验证明:该方式可以删除不具有挖掘价值的、因用户短期行为而访问的Web日志记录,剔除掉噪音数据,从而有效减小了日志挖掘的复杂度.
访问模式、LRU页面置换算法、用户短期行为、噪音数据
20
TP3;TP1
安徽科技学院青年基金ZIC2011117;安徽科技学院教研课题X201014
2011-09-06(万方平台首次上网日期,不代表论文的发表时间)
共5页
219-222,247