10.3969/j.issn.1003-6059.2012.02.006
一种基于MapReduce的频繁闭项集挖掘算法
频繁闭项集的挖掘是发现数据项之间关联规则的一种有效方式.当前以MapReduce模式为基础的云计算平台为解决海量数据中的关联规则挖掘问题提供新的解决思路.文中提出并实现一种基于Hadoop云计算平台的频繁闭项集的并行挖掘算法.该算法主要包括并行计数、构造全局频繁项表、并行挖掘局部频繁闭项集和并行筛选全局频繁闭项集四个步骤.在多个数据集上的实验表明,该方法能较大提高数据挖掘的效率,具有较好的加速比.
云计算、并行算法、数据挖掘、频繁闭项集、MapReduce
25
TP311(计算技术、计算机技术)
国家自然科学基金项目61035003,60875011,60721002;国家973计划项目2010CB327903;科技部国际科技合作计划项目2010DFA11030;江苏省自然科学基金项目BK2010054
2012-07-13(万方平台首次上网日期,不代表论文的发表时间)
共5页
220-224