10.3969/j.issn.1008-0570.2006.18.074
一种新的容错式频繁模式挖掘算法
应用容错式挖掘,更多有用的信息可以从真实世界中被噪音干扰的数据中获取.然而在过去相关的研究中,容错式频繁模式挖掘问题不是没有成熟的定义,就是将问题局限于仅找出允许固定错误数据项数的频繁模式.本文提出了比例性容错频繁模式挖掘的问题,并给出了两个实现算法.第一个算法称为FT-BottomUp,采用FT-Apriori定理找出允许所有可能错误数据项数的容错频繁模式.第二个算法FT-LevelWise将所有的容错频繁模式按照它们所允许的错误数据项目数量分成多个群组,并分别挖掘出各个群组内的频繁模式.实验结果证明我们所提出的方法可以挖掘出更多潜在的频繁模式.
数据项支持度、容错支持度、数据挖掘、容错式频繁模式
22
TP311(计算技术、计算机技术)
2006-07-31(万方平台首次上网日期,不代表论文的发表时间)
共3页
209-211