10.3969/j.issn.1007-130X.2021.09.019
基于列表结构的加权可擦除项集挖掘算法
可擦除项集挖掘是从大规模产品数据库中挖掘出低利润项集,以解决厂商财务危机的方法.传统挖掘方法只处理静态产品数据库,在提取可擦除项集时忽略项本身的权值.为解决现有可擦除项集挖掘算法考虑条件单一、效率低下的问题,提出一种有效的在增量数据集上挖掘加权可擦除项集的算法WELI.该算法综合考虑了数据不断积累和项具有不同重要性的因素,采用简洁的列表结构减少内存消耗,利用权重条件进行项集修剪,并结合包含索引和差集思想简化增益的计算过程,以实现高效的增量挖掘操作.实验表明:就运行时间和内存消耗而言,该算法在稠密数据集和稀疏数据集上均具有良好的实验效果,就可伸缩性而言,该算法也优于以往算法.
数据挖掘;可擦除项集;增量挖掘;权重条件;包含索引
43
TP311(计算技术、计算机技术)
2021-09-28(万方平台首次上网日期,不代表论文的发表时间)
共8页
1676-1683