10.3969/j.issn.1672-9722.2017.02.014
不确定数据中的代表频繁项集近似挖掘
不确定数据的频繁项集挖掘作为很多数据挖掘任务的基本步骤,引起了很多学者的关注.但是当不确定数据集的规模很大时,会产生数目巨大的频繁项集,给后续挖掘工作带来难题.为解决这一问题,论文提出不确定数据集中的代表频繁项集概念,并利用VC维的概念,确定抽样空间,提出一种基于随机抽样的代表频繁项集近似挖掘算法,在保证挖掘效果的前提下,减少了挖掘出的频繁项集的数量,提高算法的效率.
不确定数据、代表频繁项集、近似算法、VC维
45
TP311(计算技术、计算机技术)
2017-04-14(万方平台首次上网日期,不代表论文的发表时间)
共6页
266-271