10.3969/j.issn.1001-3695.2013.06.015
多格式海量数据统一存取的索引结构
为提高多格式海量数据统一存取效率,提出了一种基于Hadoop的分布式数据读取模式.并通过对海量数据非主键索引结构的研究,结合统一存取的描述理念,提出了基于HDFS的一种可适用于B-树和R-树及其变种的层次索引结构,改变了原键-值存储在非主键索引结构中的劣势.通过提出Hadoop缓冲策略、基于随机读取的新数据传输模型以及相应的查询处理策略,进一步降低了数据传输开销.实验表明,该系列方法优化了统一存取中随机存取效率,减少了相应的查询响应时间和数据传输开销,提高了多格式海量数据统一存取的性能.
R-树、索引、海量数据、查询处理
30
TP311;TP301.6(计算技术、计算机技术)
国家科技重大专项资助项目2011ZX05023-005-012
2013-08-30(万方平台首次上网日期,不代表论文的发表时间)
共4页
1664-1667