10.3969/j.issn.1002-137X.2013.02.050
在线挖掘数据流闭频繁项集的高效算法
数据流闭频繁项集挖掘算法得到了广泛的研究,其中一个典型的工作就是NewMoment算法.针对NewMoment算法存在搜索空间大而造成算法时间效率低的问题,提出了一种改进的数据流闭频繁项集挖掘算法A-New-Moment.它设计了一个二进制位表示项目与扩展的频繁项目列表相结合的数据结构,来记录数据流信息及闭频繁项集.在窗体初始阶段,首先挖掘频繁1-项集所产生的支持度为最大的最长闭频繁项集,接着提出新的“不需扩展策略”和“向下扩展策略”来避免生成大量中间结果,快速发现其余闭频繁项集,达到极大缩小搜索空间的目的.在窗体滑动阶段,提出“动态不频繁剪枝策略”来从已生成的闭频繁项集中快速删除非闭频繁项集,并提出“动态不搜索策略”来动态维护所有闭频繁项集的生成,以降低闭频繁项集的维护代价,提高算法的效率.理论分析与实验结果表明,A-New-Moment算法具有较好的性能.
数据挖掘、数据流、频繁项集、闭频繁项集
40
TP182(自动化基础理论)
国家自然基金项目51164012基金项目号;江西教育厅科技项目GJJ12347号
2013-03-21(万方平台首次上网日期,不代表论文的发表时间)
共6页
229-234