10.3969/j.issn.1007-757X.2015.10.021
一种挖掘不确定数据频繁模式的深度优先算法
随着信息技术日新月异的发展,在金融、物流以及天体研究等众多领域,时刻都会产生和记录海量的数据。而多数情况下,这些数据都存在着误差或者仅是部分完整的,数据的不确定性导致传统的数据挖掘方法不再适用于不确定数据。因而提出了一种基于垂直结构的不确定数据频繁模式挖掘算法ProEclat。ProEclat采用数据集的垂直格式表示,避免了对数据集的多次扫描,使用两阶段模型的频繁项集判断方式,大幅提高了计算效率。实验证明,ProEclat伸缩性良好,性能优于同类算法。
数据挖掘、不确定数据、深度优先、频繁模式
TP301.6(计算技术、计算机技术)
2015-11-19(万方平台首次上网日期,不代表论文的发表时间)
共4页
62-64,68