10.3969/j.issn.1000-1220.2012.01.015
基于标准编码的频繁子图挖掘算法
频繁子图挖掘是图挖掘的一个重要研究课题.gSpan算法作为一种高效的子图挖掘算法具有较好的执行效率,它通过最右扩展生成频繁子图,但不能保证每次扩展得到的均为标准编码.针对此问题本文提出了一种改进的算法CSGM,它采用ADI++存储结构,能处理更大规模的图集,同时保证每次最右扩展均生成标准编码,既避免了对非标准编码图的支持度计算,也避免了对输入编码是否为标准编码的计算.在实际数据集上运行的实验结果表明它比原算法提高了挖掘效率.
频繁子图挖掘、gSpan、最右扩展、标准编码、ADI++
33
TP311(计算技术、计算机技术)
国家自然科学基金项目60673136;河北省教育厅2009年自然科学研究计划项目2009101
2012-05-25(万方平台首次上网日期,不代表论文的发表时间)
共5页
78-82