DOI：10.3969/j.issn.1004-373X.2008.22.026

关联规则挖掘中改进型Diffsets算法

引用

摘要：

频繁项集挖掘是关联规则挖掘中至关重要的一步.对于稠密数据集的频繁项集挖掘,传统的挖掘算法往往产生大量无用的中间结果,造成内存利用率的极大浪费,尤其是在支持度较低的情况下.Diffsets算法通过引入"差集"的概念,在一定程度上解决了挖掘过程中产生的大量中间结果与内存容量之间的矛盾.改进型Diffsets算法是在原算法的基础上,在差集运算过程中根据差集中所包含的事务标识个数进行递减排序.进一步减少了挖掘过程中产生的中间结果数量.分析与实例表明,改进后的算法在执行过程中将占用更少的内存空间,加快了算法的收敛速度.

关键词：数据挖掘、关联规则挖掘、频繁项集挖掘、Diffsets

所属期刊栏目：31

分类号：TP311(计算技术、计算机技术)

资助基金：宁夏自然科学基金资助项目NZ0697;宁夏高等学校科学技术研究项目2006JY018

在线出版日期：2009-01-13（万方平台首次上网日期，不代表论文的发表时间）

页数：共5页

页码：80-83,87

英文信息展示

期刊专题