基于矩阵的关联规则增量更新及其改进算法
为了解决大数据环境下如何高效地挖掘关联规则并进行增量更新,在原有的fast updating pruning(FUP)算法基础上,首先提出一种基于矩阵的关联规则增量更新方法(MFUP),该方法将数据集转化成布尔矩阵,减少对数据集的扫描次数以及数据集的存储量;然后将MFUP与Hadoop分布式计算框架结合,提出一种分布式环境下的新算法Cloud MFUP(CMFUP);最后通过设计实验进行对比分析.结果表明,在挖掘相同数据量的关联规则并进行增量更新时,MFUP算法相比FUP算法执行时间更少,且随着数据集的增加,其增速更慢;对比CMFUP与MRFUP算法表明,随着分布式环境下数据集的增加,前者较后者执行时间更短增速更慢.
fast updating pruning (FUP)算法、关联规则、增量更新、Hadoop平台、布尔矩阵
43
TP301.6(计算技术、计算机技术)
国家自然基金61374166;北京市自然科学基金4162045;教育部博士点基金20120010110010;中央高校基本科研业务费JD1502
2016-10-18(万方平台首次上网日期,不代表论文的发表时间)
89-94