10.3969/j.issn.1004-9037.2012.04.019
在线挖掘数据流闭合频繁项集CMNL-SW算法
提出了一种新的CMNL-SW(Closed map and num list-sliding window)挖掘算法.具体使用数据结构Closed map存储挖掘到的闭合项集和Num list存储所有不同项的序号,通过对添加新事务和删除旧事务包含的项序号进行简单的并集和该事务与之相关已经挖掘到的闭合项集进行交集运算来更新当前滑动窗口,使之能够根据用户任意指定的支持度阈值在线输出数据流上闭合频繁项集信息.通过理论分析和对真实数据集Mushroom,Retail-chain和人工合成数据集T40I10D100K的挖掘结果表明,提出的算法在时空效率上明显优于同类经典算法Moment和CFI-Stream,并且随着数据流上处理事务数的递增和快速改变表现出良好的稳定性.
挖掘算法、闭合频繁项集、滑动窗口、数据流
27
TP2;TP9(自动化技术及设备)
2012-11-16(万方平台首次上网日期,不代表论文的发表时间)
共6页
508-513