关联规则中改进FP-tree的最大频繁模式挖掘算法
关联规则挖掘是数据挖掘领域中重要的研究内容,最大频繁模式挖掘又是关联规则挖掘中的关键问题之一.针对已有的最大频繁模式挖掘算法存在的问题,通过对FP-Growth、FP-Max算法的分析,提出了基于改进FP-tree的最大频繁模式挖掘算法DFP-Max.该算法使用预测、剪枝的策略减少条件FP-tree个数,采用数字集匹配代替项集匹配的方式,减少超集检验的次数,并且避免了中间结果的组合连接,从而使算法达到较高的效率.实验结果表明,在支持度相对较小情况下,DFP-Max的效率是同类算法的2~5倍.
关联规则、数据挖掘、FP-tree、最大频繁项集、超集检验
31
TP311(计算技术、计算机技术)
江苏省自然科学基金项目BK20003017
2011-01-28(万方平台首次上网日期,不代表论文的发表时间)
共4页
4635-4638