10.3969/j.issn.1001-3695.2009.11.015
面向数据流的频繁模式挖掘研究
数据流的无限性、高速性使得经典的频繁模式挖掘方法难以适用到数据流中.针对数据流的特点,对数据流中频繁模式挖掘问题进行了研究,提出了数据流频繁模式挖掘算法FP-SegCount.该算法将数据流分段并利用改进的FP-growth算法挖掘分段中的频繁项集,然后利用Count-Min Sketch进行项集计数.算法解决了压缩统计和计算快速高效的问题.通过实验分析,FP-SegCount算法是有效的.
数据流、数据挖掘、数据流挖掘、频繁模式
26
TP311(计算技术、计算机技术)
陕西省自然科学基金资助项目2004f283;西安市科技创新支撑-应用发展研究计划资助项目YF07024
2009-12-15(万方平台首次上网日期,不代表论文的发表时间)
共4页
4054-4056,4059