DOI：10.3969/j.issn.1007-130X.2007.10.021

一种挖掘XML文档频繁子树的方法

引用

摘要：

本文主要研究从由带标签有序树构成的森林中挖掘嵌入式频繁子树,具体做法是:首先对XML文档进行预处理,生成最简结构树SST,然后从SST中挖掘出频繁子树.本文提出了SSTMiner算法,该算法针对TreeMiner算法存在的瓶颈问题,结合当前所处理的SST的结构特点进行改进,进一步提高了算法执行的效率.实验证明,本文提出的方法能够准确高效地挖掘出XML文档中的频繁子树.

关键词：XML、频繁子树、TreeMiner

所属期刊栏目：29

分类号：TP311(计算技术、计算机技术)

资助基金：福建省自然科学基金A0510020

在线出版日期：2007-12-03（万方平台首次上网日期，不代表论文的发表时间）

页数：共4页

页码：65-67,104

英文信息展示

期刊专题