10.13474/j.cnki.11-2246.2016.0341
一种改进的Lucene算法及在空间数据融合中的应用
在“互联网+”时代,众源地理空间数据已成为重要的数据来源,但由于众源数据存在冗余和精度不高等问题,如何有效利用众源数据已成为地理信息技术研究的热点。众源POI数据一般通过与标准数据进行同名点匹配解决上述等问题。而同名点匹配常用的方法有编辑距离算法、最长公共子串算法、贪心字符串匹配算法,这些方法存在匹配效率低、缺少语义判断等问题。为此本文基于Lucene提出了一种基于语义相似度的快速匹配算法,试验结果表明,与传统的字符匹配方法相比,本文提出的方法在运算效率上有显著的提升,同时还能通过判断语义相似度提高匹配率。
同名点匹配、字符串匹配、Lucene索引、语义相似度
P208(一般性问题)
国家自然科学基金重点项目41431178
2016-11-18(万方平台首次上网日期,不代表论文的发表时间)
共5页
106-109,124