10.3969/j.issn.1007-130X.2007.10.021
一种挖掘XML文档频繁子树的方法
本文主要研究从由带标签有序树构成的森林中挖掘嵌入式频繁子树,具体做法是:首先对XML文档进行预处理,生成最简结构树SST,然后从SST中挖掘出频繁子树.本文提出了SSTMiner算法,该算法针对TreeMiner算法存在的瓶颈问题,结合当前所处理的SST的结构特点进行改进,进一步提高了算法执行的效率.实验证明,本文提出的方法能够准确高效地挖掘出XML文档中的频繁子树.
XML、频繁子树、TreeMiner
29
TP311(计算技术、计算机技术)
福建省自然科学基金A0510020
2007-12-03(万方平台首次上网日期,不代表论文的发表时间)
共4页
65-67,104