10.3969/j.issn.1000-7024.2006.15.015
基于卡方分析的关联模式剪枝方法研究
关联模式挖掘研究是数据挖掘研究领域的重要分支之一,旨在发现项集之间存在的关联或相关关系.然而,传统的基于支持度-可信度框架的挖掘方法存在着一些不足:一是会产生过多的模式(包括频繁项集和规则);二是挖掘出来的规则有些是用户不感兴趣的、无用的,甚至是错误的;所以在挖掘过程中能有效地对无用模式进行剪枝是必要的.将卡方分析引入到模式的相关性度量中,利用卡方检验对项集之间、规则前件与后件之间的相关性进行度量是一种有效的剪枝方法.实验结果分析表明,在支持度度量的基础上引入卡方检验可以有效地对非相关模式进行剪枝,从而减小频繁项集和规则的规模.
数据挖掘、频集、关联模式、卡方分析、剪枝
27
TP391.4(计算技术、计算机技术)
国家供销合作总社资助项目GXZSKY06012zd;安徽财经大学校科研和教改项目ACKYQ0637ZC
2006-09-11(万方平台首次上网日期,不代表论文的发表时间)
共3页
2753-2755