10.3969/j.issn.1672-9722.2021.11.001
改进的频繁模式挖掘算法
FP-growth算法是关联规则挖掘中一种经典的算法,它不需要产生候选集,只需要扫描事务数据库两次来构建项目头表和FP-Tree.但该算法项节点查询比较耗时,而且要递归生成条件FP-tree,所以内存开销大.针对上述问题,文中提出了一种基于FP-growth的新的频繁模式挖掘算法MGFP-growth.其思想是:首先算法弃用项目头表,使用二维矩阵存储事务的信息,按照矩阵列进行分组,并建立parenttrace关系;最后利用存储在数组中的gourp信息可以快速的构建频繁模式树,从而进行频繁项集的挖掘.实验表明,该算法只对事务数据库扫描一次,同时利用分组将项存储,节省了内存空间,有效解决了传统算法的固有缺陷,提高了算法效率.
FP-growth;关联规则;频繁模式;MGFP-growth
49
TP301.6(计算技术、计算机技术)
国家自然科学基金项目"基于鲁棒表现建模的目标跟踪方法研究"编号:61772244
2021-12-06(万方平台首次上网日期,不代表论文的发表时间)
共5页
2175-2179