10.3969/j.issn.2095-2163.2017.04.019
基于Hbase的大数据查询优化
Hbase有着先天的优势和先天的劣势,而劣势就是其较差的数据定位能力,也就是数据查询能力.因为面向列的特点,Hbase只能单单地以rowkey为主键作查询,而无法对表进行多维查询和join操作,并且查询通常都是全表扫描,耗费资源较大,查询效率较低.类比于传统型数据库里的一些查询方式,本文对Hbase的存储原理进行了研究,借助分布式计算框架Mapreduce在Hbase上构建了二级索引,就可以对表进行有针对性的定位和高效率的查找,同时也减轻zookeeper服务对资源调度的压力.
Hbase、大数据处理、SecondaryIndexing
7
TP311(计算技术、计算机技术)
江苏省高等学校大学生创新创业训练计划一般项目20161112216017;江苏省现代教育技术研究课题2016-R-46828
2017-09-14(万方平台首次上网日期,不代表论文的发表时间)
共3页
59-61