10.13229/j.cnki.jdxbgxb201401022
考虑层数信息的XML文档聚类方法
提出了一种层数敏感的XML文档数据集聚类方法CXLI.首先提出结构表概念,消除XML文档的重复和嵌套结构.然后提出考虑层数信息的XML文档基本编辑操作约束.进一步给出考虑层数信息的XML文档间相似性度量方法.最后使用凝聚型层次聚类方法对XML文档数据集进行聚类.在ACM SIGMOD数据集和人工生成的数据集上进行了实验验证,结果表明:在计算时间基本相同的情况下,CXLI方法具有更好的精确度.
人工智能、数据挖掘、可扩展标记语言、相似性度量、聚类、层数
44
TP18(自动化基础理论)
吉林省科技发展计划项目20090704;吉林省自然科学基金项目201115020
2016-05-17(万方平台首次上网日期,不代表论文的发表时间)
共5页
124-128