10.3969/j.issn.1001-5965.2006.02.021
一种基于有效修剪的最大频繁项集挖掘算法
对关联挖掘中的最大频繁项集挖掘问题进行了研究,提出了一种基于项集格修剪机制的最大频繁项集挖掘算法.采用项集格生成树的数据结构,将最大频繁项集挖掘过程转化为对项集格生成树进行深度优先搜索获取所有最大频繁节点的过程. 其中提高算法效率的一个重要措施是在遍历项集格生成树的过程中对生成树进行修剪.给出了项集格生成树的三个性质,并在此基础上提出了直接超集修剪、间接超集修剪与事务集等价修剪三种修剪机制,尽可能忽略非频繁节点及其所生成的扩展节点以减少遍历的节点数目.试验结果表明,三种修剪机制都能够有效地减少搜索空间,其中事务集等价修剪机制的效果最好,算法的性能与输入数据集的稠密程度相关.
数据挖掘、关联规则、关联挖掘、格
32
TP311(计算技术、计算机技术)
科技部科研项目;中国科学院项目(非规范项目)
2006-04-20(万方平台首次上网日期,不代表论文的发表时间)
共7页
218-223,243