10.3969/j.issn.1673-629X.2008.10.033
一种改进的最大频繁集发现算法
关联规则是数据挖掘的主要技术,而最大频繁集是关联规则挖掘的核心.关联规则发现的准确性与效率的好坏直接决定了发现的知识规则是否适用.阐述了关联规则、频繁集和频繁超集的定义,分析了现有关联规则算法的思想及其不足,然后在概率的基础上引入了期望长,提出了ELMFI算法,最后用实例进行仿真实验并做了比较分析.该算法直接产生期望长度的候选项集并进行验算,试验结果验证了其可行性,发现效率有所提高,能节约大量的系统空间和运算时间.
关联规则、最大频繁集、期望长、最小支持度、数据挖掘
18
TP301.6(计算技术、计算机技术)
国家自然科学基金项目40574002;广西自然科学基金项目0448076
2008-11-27(万方平台首次上网日期,不代表论文的发表时间)
共4页
113-115,119