10.11896/j.issn.1002-137X.2014.07.047
面向分布式的SPARQL查询优化算法
采用分布式来实现SPARQL(Simple Protocol and RDF Query Language)查询是解决海量RDF(Resource Description Framework)查询的一种新思路.目前实现的基于Hadoop的RDF查询都要启用多个MapReduce来完成任务,浪费时间.为了克服此缺点,提出MRQJ (using MapReduce to query and join)算法,用以实现SPARQL的分布式查询.该算法分为连接计划生成与SPARQL查询执行两个部分:连接计划生成采用贪心策略,生成最优的连接方案;在SPARQL查询执行中只需结合一次MapReduce计算即可得到查询结果.在LUBM数据集上进行的测试实验表明:在查询语句较为复杂的情况下,MRQJ方法的查询效率具有明显的优势.
RDF、Hadoop、SPARQL查询、MapReduce
41
TP391(计算技术、计算机技术)
福州大学科技发展基金资助项目2013-XQ-32;空间数据挖掘与信息共享教育部重点实验室开放研究基金项目201006;2011年福建省科技拥军基金项目JG2011005;福建省自然科学基金项目2012J01168
2014-09-16(万方平台首次上网日期,不代表论文的发表时间)
共5页
227-231