10.3969/j.issn.1672-9870.2019.02.026
一种基于倒排索引的频繁项集挖掘方法
针对频繁项集挖掘算法中多次扫描数据库、生成大量无效频繁项集的问题,提出一种基于倒排索引和二维数组的挖掘算法.通过一次扫描数据库建立包含事务的倒排索引,解决多次扫描数据库的问题.在二维数组存储候选频繁项集时,引入标志位约束,避免产生大量无效的频繁项集.与其他算法在不同规模的数据集上进行性能比较,发现算法在数据集超过25万时执行效率优于其他算法.通过实验验证了所提出算法的高效性和可行性.
频繁项集挖掘、倒排索引、二维数组
42
TP391(计算技术、计算机技术)
吉林省科技厅项目KYC-JC-XM-2018-03;吉林省教育厅科技攻关项目KYC-JC-XM-2016-021
2019-11-29(万方平台首次上网日期,不代表论文的发表时间)
共4页
117-119,124