10.16208/j.issn1000-7024.2020.03.019
基于差异点集的频繁项集挖掘算法
针对目前频繁模式挖掘算法存在的建树复杂、挖掘效率低下等问题,提出一种基于差异点集(DiffNodeset)的Toprankk频繁模式挖掘DNTK算法.利用差集运算直接获取k(>2)项集的差异点集,避免项集多次复杂连接过程;结合一种线性时间复杂度连接方法和早期修剪策略,提出一种更为高效的1-项集连接方法,及时判定项集连接可行性;采用包含索引策略减少项集连接次数.实验结果表明,DNTK算法在时间和空间效率方面性能优于FAE和NTK算法,在不同类型数据集中进行频繁项集挖掘时有良好的效果.
频繁项集挖掘、差异点集、优先k项集、早期修剪、包含索引
41
TP301.6(计算技术、计算机技术)
2020-05-07(万方平台首次上网日期,不代表论文的发表时间)
共5页
716-720