10.3969/j.issn.1001-0548.2010.05.023
关于Top-N最频繁项集挖掘的研究
最频繁项集挖掘决定了文本关联规则挖掘算法的性能,是文本关联规则挖掘中研究的重点和难点.该文分析了当前最频繁项集挖掘方面的不足,改进了传统的倒排表,结合最小支持度阈值动态调整策略,提出了一个新的基于改进的倒排表和集合理论的Top-N最频繁项集挖掘算法.同样,给出了几个命题和推论,并把它们用于该文算法以提高性能,实验结果表明,所提算法的规则有效率和时间性能优于NApriori算法和IntvMatrix算法.
关联规则、倒排表、频繁项集、集合理论、支持度
39
TP301.6(计算技术、计算机技术)
四川省科技计划项目2008GZ0003
2010-11-10(万方平台首次上网日期,不代表论文的发表时间)
共6页
757-761,773