10.3969/j.issn.1006-9348.2019.12.088
基于希尔伯特R树和LDA的混合机制研究
现有的空间关键词搜索方法通常采用以R树为主的混合索引,根据查询位置找到相关文本,查询时通过编辑距离或统计语言模型进行简单的文本匹配.然而多维R树的空间区域重叠率较高,且简单的文本匹配易造成语义相关的文本丢失.为了提高空间查询效率和文本匹配的准确率,构建了一种有效的混合索引结构希尔伯特信息检索树(Hilbert Retrieving information-Tree,HRI-Tree)并进行top-k查询,在Hilbert R树的节点中加入关键词的倒排索引,并采用LDA主题模型,通过主题分类更准确地查询到语义相关的文本,返回与查询文本近似匹配且空间距离相近的top-k结果.上述算法在实验中与当前的方法在查询所需时间、节点重叠覆盖率、文本匹配的准确率等方面进行了比较,显示出其优越的性能.
空间关键词、主题模型、混合索引、查询
36
TP391.9(计算技术、计算机技术)
国家自然科学基金项目;东南大学计算机网络和信息集成教育部重点实验室;江苏省自然科学基金面上项目;江苏省高校自然科学研究面上项目
2020-04-08(万方平台首次上网日期,不代表论文的发表时间)
共6页
415-420