10.3969/j.issn.1006-9348.2010.11.019
一种基于条件矩阵的最大频繁项集挖掘算法
在数据挖掘问题的研究中,为减少候选最大频繁项集数量和降低超集存在判断的开销,为了优化算法,提出了一种基于条件矩阵挖掘最大频繁项集的算法(conditional matrix for maximal frequent itemsets,CMMFI).将压缩频繁模式树表示的频繁项集信息投影到条件矩阵,采用最大顺序尾项排序和扩展2项集剪枝,有效削减了搜索空间,提高了算法的空间效率.使用标号数组优化超集检测的过程,减少了频繁项集比较的次数,减少了花费时间.最后,选用了两个模式长度不同的数据集,将算法与FPMax算法进行性能比较,实验结果验证了算法的有效性和优越性.
数据挖掘、最大频繁项集、条件矩阵、压缩频繁模式树
27
TP311(计算技术、计算机技术)
江西省自然科学基金项目0611065;江西省自然科学基金项目2007GZS2246
2011-01-28(万方平台首次上网日期,不代表论文的发表时间)
共5页
73-77