10.3969/j.issn.1673-629X.2017.10.007
基于FP-tree的支持度计数优化策略
关联规则挖掘过程中,频繁项集的挖掘是最关键的步骤.最大频繁项集是最常用的频繁项集简化表示.基于FP-tree的最大频繁项集挖掘算法多数都需要自底向上地搜索FP-tree来计算项集的支持度.而已有的支持度计算方法在计算当前项集的支持度时没有考虑已完成的支持度计算过程所获得的信息,因而造成了不必要的开销.针对该问题,提出了基于FP-tree的支持度计数优化策略(Support Count Optimization Method on FP-tree,SCOM),在付出很小的额外空间代价的条件下,充分利用已完成的支持度计数过程中获取的路径对项集的支持信息和项集之间的关系进行搜索剪枝,并设计实验将该策略应用到DMFIA算法上.实验结果表明,应用该策略的最大频繁项集挖掘算法DMFIA获得了较大的性能提升.SCOM对基于FP-tree的支持度计数进行优化,因此能够应用到所有利用FP-tree进行支持度计数的算法之中.
关联规则挖掘、FP-tree、最大频繁项集、支持度计数、搜索剪枝
27
TP311(计算技术、计算机技术)
国家科技重点专项"核高基"2015ZX01040-201
2017-11-17(万方平台首次上网日期,不代表论文的发表时间)
共5页
30-33,38