挖掘闭合模式的高性能算法
频繁闭合模式集惟一确定频繁模式完全集并且尺寸小得多,然而挖掘频繁闭合模式仍然是时间与存储开销很大的任务.提出一种高性能算法来解决这一难题.采用复合型频繁模式树来组织频繁模式集,存储开销较小.通过集成深度与宽度优先策略,伺机选择基于数组或基于树的模式支持子集表示形式,启发式运用非过滤虚拟投影或过滤型投影,实现复合型频繁模式树的快速生成.局部和全局剪裁方法有效地缩小了搜索空间.通过树生成与剪裁代价的平衡实现时间效率与可伸缩性最大化.实验表明,该算法时间效率比其他算法高5倍到3个数量级,空间可伸缩性最佳.它可以进一步应用到无冗余关联规则发现、序列分析等许多数据挖掘问题.
知识发现、数据挖掘、频繁闭合模式、关联规则
15
TP311(计算技术、计算机技术)
浙江省自然科学基金602140;国家自然科学基金60272031;高等学校博士学科点专项科研项目20010335049;国家计委科技攻关项目JGJ-1998-2077
2004-03-12(万方平台首次上网日期,不代表论文的发表时间)
共9页
94-102