10.16208/j.issn1000-7024.2020.02.023
基于多效用阈值的分布式高效用序列模式挖掘
针对序列模式的高效用模式挖掘过程中搜索空间大、计算复杂度高的问题,提出一种基于多效用阈值的分布式高效用序列模式挖掘算法.采用数组结构保存模式的效用信息,解决效用矩阵导致的内存消耗大的缺点.设计1-项集与2-项集的深度剪枝策略,深入地缩小候选模式的搜索空间,减少搜索时间成本与缓存成本.提出挖掘算法的分布式实现方案,通过并行处理进一步降低模式挖掘的时间.基于中等规模与大规模的序列数据集分别进行实验,实验结果表明,该算法有效减少了候选模式的数量,降低了挖掘的时间成本与存储成本,对于大数据集表现出较好的可扩展能力与稳定性.
序列模式、大数据、高效用模式挖掘、分布式计算、频繁项集、剪枝策略
41
TP391(计算技术、计算机技术)
福建省科技厅引导性基金项目 ;广西壮族自治区教育厅 2019 年度广西高校中青年教师科研基础能力提升基金项目
2020-04-14(万方平台首次上网日期,不代表论文的发表时间)
共9页
449-457