10.3969/j.issn.1673-629X.2016.09.044
基于路径权重的XML文档相似度仿真研究
针对XML文档查询效率低和准确度不理想的问题,提出一种基于路径权重的树相似度算法。该算法以树节点信息相似度和树结构相似度为出发点,依据信息组织主次分明的客观规律,信息按照重要程度依次排列在树的各个层次,树节点信息自上至下重要程度逐渐减弱。根据距离根节点越近的节点表示的信息越重要,最低层信息的重要性最小的特点,依照树节点在XML文档树中的层次自动计算该节点的路径权重,克服了传统XML文档树相似度计算中树节点信息权重平均分配或手工设置的缺点,解决了XML文档树的相似度自动计算问题,实现了XML查询树与文档树的快速匹配。仿真结果表明,该算法在大量XML文档检索方面查询效率、查准率和查全率都得到有效改进。
相似度、路径权重、查询树、文档树
26
TP391.9(计算技术、计算机技术)
国家自然科学基金资助项目61272284;陕西省自然科学基金2014JM8354;陕西省教育重点实验室科技项目13JS083
2016-10-19(万方平台首次上网日期,不代表论文的发表时间)
共4页
197-200