10.3969/j.issn.1000-3428.2014.03.010
基于不确定性数据的频繁闭项集挖掘算法
对于不确定性数据,传统判断项集是否频繁的方法并不能准确表达项集的频繁性,同样对于大型数据,频繁项集显得庞大和冗余。针对上述不足,在水平挖掘算法 Apriori 的基础上,提出一种基于不确定性数据的频繁闭项集挖掘算法 UFCIM。利用置信度概率表达项集频繁的准确性,置信度越高,项集为频繁的准确性也越高,且由于频繁闭项集是频繁项集的一种无损压缩表示,因此利用压缩形式的频繁闭项集替代庞大的频繁项集。实验结果表明,该算法能够快速地挖掘出不确定性数据中的频繁闭项集,在减少项集冗余的同时保证项集的准确性和完整性。
不确定性数据、频繁闭项集、数据挖掘、水平挖掘、置信度概率
TP311.12(计算技术、计算机技术)
2014-04-15(万方平台首次上网日期,不代表论文的发表时间)
共4页
51-54