10.3969/j.issn.1673-629X.2013.09.016
基于PFP-Growth算法的海量频繁项集挖掘
随着互联网技术的发展,网络数据变得越来越巨大,如何从中挖掘有效信息成为人们研究的重点。近年来频繁项集挖掘由于其在关联规则挖掘、相关挖掘等任务中的相关重要作用,越来越受到人们的重视。文中针对分布式计算环境下频繁项集挖掘算法的研究,对PFP-Growth算法进行了改进,通过MapReduce编程模型对改进的PFP-Growth算法进行了实现和应用,使用户可以从海量数据中高效地获得所有需要的频繁项集。实验结果表明算法在针对海量数据时具有较高的效率和伸缩性。
频繁项集、海量数据、PFP-Growth
TP31(计算技术、计算机技术)
安徽高校省级自然科学研究项目kj2011z039;安徽工业大学硕士研究生导师创新基金项目D2011024
2013-10-17(万方平台首次上网日期,不代表论文的发表时间)
共4页
63-65,198