10.3969/j.issn.1000-3428.2005.16.027
在大型数据集上提高序列挖掘效率的统计方法
分析了在大型事务集合发现频繁模式的特点,给出了一个改进算法(称为AprioriAdjust算法),同时,发展了两项技术:(1)提出了事务集合的压缩过程.(2)展示了一种基于统计模式的方法来评价序列的支持度,在该方法中,考虑了整个过程中每一趟的支持度均值的收敛性,以进行有效的候选频繁集的剪枝.此外,还讨论了实验结果.比较AprioriTID算法,研究展示,AprioriAdjust算法在进行大型事务集合的挖掘时更有效,可扩展性更强.
数据挖掘、序列模式挖掘、最大频繁项目集、统计模型
31
TP111(自动化基础理论)
国家高技术研究发展计划863计划
2005-09-15(万方平台首次上网日期,不代表论文的发表时间)
共3页
69-70,91