10.3969/j.issn.1673-629X.2017.01.042
大数据时代电子政务中XML文档相似性
XML作为电子政务应用中的数据交换标准已经被广泛研究。随着大数据时代的到来,对电子政务中XML数据的管理也显得越来越重要。在XML数据的管理中,XML文档的相似性是XML数据集成、XML数据分类的关键。为了研究XML文档的相似性,针对XML文档进行了树形变换,并提取树节点的相应特征,然后分别利用这些特征对节点进行相应的相似性计算,再将得到的相似性利用ELM(超限学习机)算法进行拟合得到最终的节点相似性。在节点相似性的基础上提出了XML文档树的相似性比较算法,从而计算得到XML文档的相似性。实验部分在给出具体的评估指标的基础上,在两个不同的数据集上给出使用文中方法所得到的精确度、召回率、F-measure值以及相应时间的对比情况,通过实验验证了所提方法的性能优势。
XML文档、相似性、特征提取、拟合、数据集成
27
TP393(计算技术、计算机技术)
教育部人文社会科学研究青年基金项目15YJC870028;辽宁省自然科学基金2015020009;辽宁省哲学社会科学规划基金项目L15BTQ002;辽宁省社科联2015年度辽宁经济社会发展立项课题2015lslktglx-01
2017-03-20(万方平台首次上网日期,不代表论文的发表时间)
共5页
186-189,194