基于分区的频繁子树挖掘算法研究
针对基于模式增长原理的嵌入式子树挖掘算法--TreeGrowth(TG)算法挖掘子树过大与内存消耗大缺点,在分区挖掘思想的基础上,提出了一种新算法--PTG(partition tree growth)算法.PTG算法将数据库划分成多个分区,先用TG算法进行挖掘,得到每个分区的局部频繁子树.根据全局支持数进行筛选,得到全局频繁子树,有效地减少了挖掘的子树,有效地降低了内存的开销.仿真实验结果表明,PTG算法能够解决在大数据集上挖掘时出现内存空间不足的问题,验证了其有效性与健壮性.
模式挖掘、频繁子树、模式增长、投影、分区挖掘
32
TP301.6(计算技术、计算机技术)
2011-10-20(万方平台首次上网日期,不代表论文的发表时间)
共4页
2054-2057