10.3969/j.issn.0258-2724.2012.06.019
基于分布式的频繁闭合模式挖掘算法
为提高数据挖掘效率,提出了一种基于分布式的频繁闭合模式挖掘算法——PFCI-Miner.该算法采用任务分布的主从方式,其中主处理器通过发送提出的前缀路径表(PrePthx)将挖掘任务合理划分,而从处理器借助提出的存储树(Trac-tree)挖掘局部频繁闭合模式,最后由主处理器挖掘出全局频繁闭合模式.此外,采用星形拓扑结构,使数据通信只存在于主处理器与从处理器之间,而各从处理器之间无数据通信且不需要同步.在由3台PC机构成的分布式环境下,对合成与蘑菇数据集的实验表明,PFCI-Miner较DP-FP算法、AFCIM算法和DFCIM算法的执行效率分别平均提高了43.66%、42.17%、53.48%和51.86%、47.62%、62.78%.
关联规则、数据挖掘、频繁闭合模式
47
TP311.13(计算技术、计算机技术)
陕西省自然科学基金资助项目2009JM7007
2013-04-11(万方平台首次上网日期,不代表论文的发表时间)
共7页
1027-1033