10.3969/j.issn.1007-855x.2009.05.007
一种面向数据流的频繁项集挖掘算法
与传统静态数据库中的数据不同,数据流是一个按时间到达的有序的项集,这使得经典的频繁项集挖掘算法难以适用到数据流中.根据数据流的特点,提出了数据流频繁项集挖掘算法FP-SegCount.该算法将数据流分段并利用改进的FP-growth算法挖掘分段中的频繁项集.然后,利用Count Min Sketch进行项集计数.算法解决了压缩统计和计算快速高效的问题.通过和FP-DS算法的实验对比,FP-SegCount算法具有较好的时间效率.
数据流、数据挖掘、数据流挖掘、频繁项集
34
TP311.13(计算技术、计算机技术)
国家自然科学基金60573096;陕西省自然科学基金项目2004f283;西安市科技创新支撑-应用发展研究计划项目YF07024
2009-12-15(万方平台首次上网日期,不代表论文的发表时间)
共6页
26-30,35