10.3969/j.issn.1000-3428.2007.02.025
长生物数据集中频繁闭合模式挖掘算法研究
传统频繁项集挖掘算法在处理稠密或长数据集(如基因表达数据集)时效率低且产生大量冗余模式,为解决这些问题一些学者提出了闭合模式的概念和挖掘闭合模式的算法,研究证明挖掘闭合模式可以显著减少项集数量并消除大量冗余模式.该文针对生物数据特点提出了一个新颖的挖掘频繁闭合模式的算法REMFOR,该算法在闭合模式概念和行枚举思想的基础上,采用垂直数据结构和fp-tree技术,对行集建立行fp-tree来挖掘频繁闭合模式.通过实例和实验证明该算法是正确有效的.
数据挖掘、频繁项集、闭合模式
33
TP31(计算技术、计算机技术)
国家自然科学基金60433020
2007-03-12(万方平台首次上网日期,不代表论文的发表时间)
共3页
74-76