挖掘数据流中的频繁模式
发现数据流中的频繁项是数据流挖掘中最基本的问题之一.数据流的无限性和流动性使得传统的频繁模式挖掘算法难以适用.针对数据流的特点,在借鉴FP-growth算法的基础上,提出了一种数据流频繁模式挖掘的新方法:FP-DS算法.算法采用数据分段的思想,逐段挖掘频繁项集,用户可以连续在线获得当前的频繁项集,可以有效地挖掘所有的频繁项集,算法尤其适合长频繁项集的挖掘.通过引入误差ε,裁减了大量的非频繁项集,减少了数据的存储量,也能保证整个数据集中项目集支持度误差不超过ε.分析和实验表明算法有较好的性能.
数据流、频繁模式、FP-DS算法、流数据挖掘
42
TP311(计算技术、计算机技术)
江苏省高技术研究发展计划项目BG2004034;江苏省研究生培养创新工程项目xm04-36
2006-01-12(万方平台首次上网日期,不代表论文的发表时间)
共7页
2192-2198