基于Spark和Redis的大规模RDF数据查询系统

引用

摘要：

随着语义Web技术的不断发展,RDF数据量增长迅速,单机RDF查询系统已经难以满足现实需要,研究和构建分布式RDF查询系统已经成为学术界与工业界的研究热点之一.现有的RDF查询系统主要是基于Hadoop或通用分布式技术.前者磁盘I/O太高;后者则可扩展性较差.且两种系统在基本图模式查询时,效率都较低.针对上述问题,本文设计了基于Spark和Redis的分布式系统架构,并改进了查询计划生成算法,最后实现了原型系统RDF-SR.该系统使用Spark减少了磁盘I/O,借助Redis提高了数据映射速率,利用改进的算法减少了数据混洗次数.实验表明,相比于现有的其他系统,RDF-SR既保持了较高可扩展性,又在基本图模式查询时,具有更高的性能.

关键词：语义Web、大规模RDF、Spark、Redis

所属期刊栏目：26

分类号：TP3;O6

在线出版日期：2017-10-20（万方平台首次上网日期，不代表论文的发表时间）

页数：共6页

页码：69-74

英文信息展示

期刊专题