10.3969/j.issn.2095-6835.2010.18.063
一种基于hash和项集空间划分的关联规则挖掘算法
在数据挖掘中关联规则是一个重要的研究方向.Apriori算法是关联规则中最著名的算法.本文针对Apriori算法的缺陷,提出一种改进算法(SAVM).新算法采用向量运算来实现项集支持度计数,大大减少扫描数据库的次数:运用hash函数直接生成频繁2项集;利用基于前缀的划分方法对频繁项集Lk-1进行划分,在相对较小的独立子空间内进行连接生成候选k-项集,减少连接过程中模式匹配的次数,提高连接速度.实验证明,改进算法大幅提高了原算法的效率.
关联规则、SAVM算法、频繁项集
26
TP311(计算技术、计算机技术)
2014-07-08(万方平台首次上网日期,不代表论文的发表时间)
共3页
154-156