基于Hadoop平台的语义数据查询策略研究-期刊-万方数据知识服务平台

HEADERS

搜索

DOI: 10.3778/j.issn.1673-9418.1509010

基于Hadoop平台的语义数据查询策略研究

1.中南大学软件工程学院,长沙,4100732.中南大学软件工程学院,长沙,4100733.中南大学软件工程学院,长沙,4100734.中南大学软件工程学院,长沙,410073

在线阅读下载

引用

打印

摘要：为了实现对海量RDF（resource description framework）数据的高效查询，研究了RDF三元组在分布式数据库HBase中的存储方法，基于MapReduce设计了海量RDF数据的两阶段查询策略，将查询分为SPARQL （simple protocol and RDF query language）预处理阶段与分布式查询执行阶段。SPARQL预处理阶段设计实现了基于SPARQL变量关联度的查询划分算法JOVR（join on variable relation），通过计算SPARQL查询语句中变量的关联度确定连接变量的连接顺序，根据连接变量将SPARQL子句连接操作划分到最小数量的Map-Reduce任务中；分布式查询执行阶段执行SPARQL预处理阶段划分的MapReduce任务，实现对海量RDF数据的并行查询。在LUBM标准测试数据集中的实验表明，JOVR算法能够高效地实现对海量RDF数据的查询，并具有良好的稳定性与可扩展性。

关键词：

并行处理语义信息查询策略 MapReduce SPARQL 海量RDF

分类号：

TP391(计算技术、计算机技术)

资助基金：

The National Natural Science Foundation of China under Grant Nos.61301136，61272148

在线出版日期：

2016-08-01 （万方平台首次上网日期，不代表论文的发表时间）

页数：

11 ( 948-958 )

英文信息

同项目论文

:The National Natural Science Foundation of China under Grant Nos.61301136，61272148

[1] 刘宏韬 , 刘伟 , 胡志刚 . 基于抽象语法树的数据泥团自动检测研究 [J]. 计算机应用与软件 . 2017 ,34(1).15-20. DOI: 10.3969/j.issn.1000-386x.2017.01.003 .

[2] 周舟 , 胡志刚 . 云计算中融入贪心策略的调度算法研究 [J]. 小型微型计算机系统 . 2015 ,36(5).1024-1027.

[3] 冼伟成 , 刘伟 , 刘宏韬 ,等. 面向对象软件度量因子的幂律分布研究 [J]. 计算机应用与软件 . 2018 ,35(1).9-14,141. DOI: 10.3969/j.issn.1000-386x.2018.01.002 .

[4] 秦启飞 , 王世振 , 袁翔 ,等. 云环境下基于 CROTS 算法的虚拟机放置策略 [J]. 计算技术与自动化 . 2015 ,(1).105-110. DOI: 10.3969/j.issn.1003-6199.2015.01.023 .

[5] 罗恩韬 , 胡志刚 , 林华 . 一种大数据时代海量数据抽取的开发模型研究 [J]. 计算机应用研究 . 2013 ,30(11).3269-3271,3275. DOI: 10.3969/j.issn.1001-3695.2013.11.015 .

[6] 梁杨 , 任胜兵 , 胡志刚 . 纸币冠字号预处理及组合特征识别方法 [J]. 计算机工程与设计 . 2015 ,(8).2223-2228,2249. DOI: 10.16208/j.issn1000-7024.2015.08.042 .

[7] 刘伟 , 胡志刚 , 刘宏韬 . 单例模式导向的源代码自动重构研究 [J]. 小型微型计算机系统 . 2014 ,35(12).2664-2669. DOI: 10.3969/j.issn.1000-1220.2014.12.015 .

[8] 马华 , 胡志刚 , 张红宇 . 云计算环境下可信服务的个性化推荐框架 [J]. 小型微型计算机系统 . 2014 ,35(5).967-972. DOI: 10.3969/j.issn.1000-1220.2014.05.005 .

[9] 肖鹏 , 胡志刚 , 屈喜龙 . 面向数据密集型工作流的能耗感知调度策略 [J]. 通信学报 . 2015 ,36(1).149-158. DOI: 10.11959/j.issn.1000-436x.2015017 .

[10] 周舟 , 胡志刚 . 云环境下面向能耗降低的虚拟机部署算法 [J]. 华南理工大学学报（自然科学版） . 2014 ,42(5).109-114. DOI: 10.3969/j.issn.1000-565X.2014.05.017 .

1
2
3

计算机科学与探索

北大核心 CSTPCD

ISSN：1673-9418

年,卷(期)：2016,10(7)

所属栏目：数据库技术

评审材料打包下载

FOOTERS