10.3969/j.issn.1672-9315.2009.04.026
一种FP-growth的改进算法
FP-growth是关联规则挖掘中一种效率较高的算法,它不产生候选集,但仍需多次遍历结果集L.针对此问题提出了一种基于Hash表的改进算法HFP-growtH(Hash FP-growth).该算法将结果集L的数据以项名称对应项支持度计数的形式存入Hash表,在找某个项的支持度计数时给Hash表传入项名称直接返回对应的支持度计数,改变了以往多次遍历结果集L的方法,从而节省了遍历时间,提高了挖掘效率.实验结果表明,改进后的算法性能明显优于原算法,并将其应用于名智网上招聘系统之中.
数据挖掘、频繁项目集、关联规则、FP-growth
29
TP311(计算技术、计算机技术)
陕西省教育厅自然科学专项基金项目07JK314
2009-08-05(万方平台首次上网日期,不代表论文的发表时间)
共5页
491-494,504