10.3321/j.issn:0469-5097.2009.05.009
有效的XML检索结果的相似性度量
相似性度量是聚类等问题中的核心问题.本文研究了XML检索结果的相似性度量,提出了一种新的结构的和内容的XML检索结果相似性度量.首先,在结构方面,提出了两个结构相似性度量:纵向结构相似度和横向结构相似度,它们基于不同的特征集,体现了结构的不同方面的相似度.在内容方面.提出用带有结构的内容模型来描述内容,基于这一内容模型提出了内容相似度.最后进行了实验,在实际数据集和合成数据集上的实验结果都显示,结构相似度和内容相似度都具有很好的准确性.
XML检索结果、相似性度量、结构相似度、内容相似度
45
TP311.13(计算技术、计算机技术)
国家自然科学基金60763001,60803105/F020606;国家社会科学基金07BTQ025
2009-12-11(万方平台首次上网日期,不代表论文的发表时间)
共9页
629-637