10.3969/j.issn.1006-9348.2013.01.076
基于粗糙集的改进Apriori算法研究
针对Apriori算法的不足,提出一种基于粗糙集的频繁项集发现方法.新方法首先利用粗糙集的特征属性约简算法进行属性约简,找到其中的核心属性数据,然后在构建约简决策表的基础上应用改进的Apriori算法对这些核心数据进行数据挖掘,最终得到频繁项集.改进方法的优势在于在保证知识库分类能力不变的前提下消除不必要的冗余属性,减少了属性数目.在生成频繁项目集方面,根据k-1频繁项集中的项目个数来确定是否生成对应的k-候选集,这样就不需要进行连接操作生成k-候选集,减少了候选项集的生成数量.实验验证了所提出的改进算法的有效性,尤其在k很大的时候,可以节省大量的计算时间,避免产生大量的候选集,可显著提高数据挖掘的效率.
粗糙集、候选集、频繁项集
30
TP301.6(计算技术、计算机技术)
2013-03-22(万方平台首次上网日期,不代表论文的发表时间)
共5页
329-332,385