10.3969/j.issn.1000-3428.2014.03.011
基于矩阵的数据流Top-k频繁项集挖掘算法
传统的数据挖掘算法在挖掘频繁项集时会产生大量的冗余项集,影响挖掘效率。为此,提出一种基于矩阵的数据流Top-k频繁项集挖掘算法。引入2个0-1矩阵,即事务矩阵和二项集矩阵。采用事务矩阵表示滑动窗口模型中的事务列表,通过计算每行的支持度得到二项集矩阵。利用二项集矩阵得到候选项集,将事务矩阵中对应的行做逻辑与运算,计算出候选项集的支持度,从而得到Top-k频繁项集。把挖掘的结果存入数据字典中,当用户查询时,能够按支持度降序输出Top-k频繁项集。实验结果表明,该算法在挖掘过程中能避免冗余项集的产生,在保证正确率的前提下具有较高的时间效率。
数据挖掘、数据流、滑动窗口、矩阵、Top-k频繁项集
TP311.13(计算技术、计算机技术)
2014-04-15(万方平台首次上网日期,不代表论文的发表时间)
共5页
55-58,75