树-投影关联规则挖掘方法的水平优化与搜索策略研究
基于树-投影的TreeProject关联规则挖掘算法有效解决了现有各种算法在数据量过大时会失效的问题.通过对该算法及相关算法的研究,发现在现有这类算法中存在冗余投影,为此提出的水平优化策略通过消除这种冗余投影,既可减少树-投影的搜索空间,加快频繁项的挖掘;还可减少树-投影算法需要的内存空间,克服了原有树-投影算法对内存要求较大的不足;该优化策略包括挖掘时的合并策略和挖掘后的生成策略两大部分.此外,冗余投影的判断,可从投影数据库T间的关系简化为相应事务编号数据库Tid间的关系,这种简化极大减少了判断的计算量,而且可用于投影,从而使得进行水平优化无需增加额外开销.基于水平优化策略的HOP-TreeProject算法从时间和空间上都对现有的树-投影算法有很大改进.实验结果表明,HOP-TreeProject在性能上显著优于TreeProject.
关联规则、树-投影、水平优化、数据挖掘
41
TP311.13;TP391(计算技术、计算机技术)
国家自然科学基金60271019;高等学校博士学科点专项科研项目20020611007;重庆大学校科研和教改项目716411038
2004-07-31(万方平台首次上网日期,不代表论文的发表时间)
共10页
946-955