10.11772/j.issn.1001-9081.2015.07.1921
基于模式增长的不确定数据的频繁模式挖掘算法
为提高不确定数据频繁模式(FP)挖掘算法的时空效率,提出了基于最大概率的不确定频繁模式挖掘(UFPM-MP)算法.首先,利用事务项集中的最大概率值预估期望支持数;然后,使用该期望支持数与最小期望支持数阔值进行比较,以确定某一项集是否为候选频繁项集,并对候选项集建立子树以递归挖掘频繁模式.实验中,UFPM-MP算法与AT-Mine算法进行了对比,并在6个典型的数据集上进行实验验证.实验结果表明,UFPM-MP算法的时空效率得到了提高,稀疏数据集上提高约30%,稠密数据集上的效率提高更为明显(约3~4倍).预估期望支持数的策略有效地减少了子树和头表项的数量.从而提高了算法的时空效率;且最小期望支持数越小,或需要挖掘的频繁模式越多的时候,算法的时间效率提高越多.
不确定数据、频繁模式、频繁项集、模式增长
35
TP311.13(计算技术、计算机技术)
国家自然科学基金资助项目61370200;宁波市自然科学基金资助项目2013A610115,2014A610073;浙江省教育厅一般科研项目Y201432717;宁波大红鹰学院大宗商品专项课题1320133004
2015-10-08(万方平台首次上网日期,不代表论文的发表时间)
共6页
1921-1926