10.3969/j.issn.1673-629X.2017.08.012
一种自底向上的最大频繁项集挖掘方法
频繁项集挖掘是关联规则挖掘中最关键的步骤.最大频繁项集是一种常用的频繁项集简化表示方法.自顶向下的最大频繁项集挖掘方法在最大频繁项集维度远小于频繁项数时往往会产生过多的候选频繁项集.已有的自底向上的最大频繁项集挖掘方法或者需多次遍历数据库,或者需递归生成条件频繁模式树,而预测剪枝策略有进一步提升的空间.为此,提出了基于最小非频繁项集的最大频繁项集挖掘算法(BNFIA),采用基于DFP-tree的存储结构,通过自底向上的方式挖掘出最小非频繁项集,利用最小非频繁项集的性质进行预测剪枝,以缩小搜索空间,再通过边界频繁项集快速挖掘出最大频繁项集.验证实验结果表明,提出算法的性能较同类算法有较为明显的提升.
最大频繁项集、关联规则挖掘、FP-tree、最小非频繁项集、边界频繁项集
27
TP311(计算技术、计算机技术)
国家科技重点专项"核高基"2015ZX01040-201
2017-09-14(万方平台首次上网日期,不代表论文的发表时间)
共5页
57-60,65