DOI：10.3321/j.issn:0469-5097.2009.05.009

有效的XML检索结果的相似性度量

引用

摘要：

相似性度量是聚类等问题中的核心问题.本文研究了XML检索结果的相似性度量,提出了一种新的结构的和内容的XML检索结果相似性度量.首先,在结构方面,提出了两个结构相似性度量:纵向结构相似度和横向结构相似度,它们基于不同的特征集,体现了结构的不同方面的相似度.在内容方面.提出用带有结构的内容模型来描述内容,基于这一内容模型提出了内容相似度.最后进行了实验,在实际数据集和合成数据集上的实验结果都显示,结构相似度和内容相似度都具有很好的准确性.

关键词：XML检索结果、相似性度量、结构相似度、内容相似度

所属期刊栏目：45

分类号：TP311.13(计算技术、计算机技术)

资助基金：国家自然科学基金60763001,60803105/F020606;国家社会科学基金07BTQ025

在线出版日期：2009-12-11（万方平台首次上网日期，不代表论文的发表时间）

页数：共9页

页码：629-637

英文信息展示

期刊专题