10.11772/j.issn.1001-9081.2020101561
含负项top-k高效用项集挖掘算法
含负项高效用项集(HUI)挖掘是新兴的数据挖掘任务之一.为了挖掘满足用户需求的含负项HUI结果集,提出了含负项top-k高效用项集(THN)挖掘算法.为了提升THN算法的时空性能,提出了自动提升最小效用阈值的策略,并采用模式增长方法进行深度优先搜索;使用重新定义的子树效用和重新定义的本地效用修剪搜索空间;使用事务合并技术和数据集投影技术解决多次扫描数据库的问题;为了提高效用计数的速度,使用效用数组计数技术计算项集的效用.实验结果表明,THN算法的内存消耗约为HUINIV-Mine算法的1/60,约为FHN算法的1/2;THN算法的执行时间是FHN算法的1/10;而且该算法在密集数据集上的性能更好.
项集挖掘;高效用项集;top-k项集;负项;正项
41
TP311;TP391.3(计算技术、计算机技术)
国家自然科学基金资助项目;宁夏自然科学基金资助项目;计算机应用技术自治区重点学科项目;宁夏高等学校一流学科建设项目电子科学与技术学科
2021-08-23(万方平台首次上网日期,不代表论文的发表时间)
共10页
2386-2395