10.3969/j.issn.1000-3428.2018.06.005
基于共享存储的MPP数据库连接执行研究
为解决哈希分布表转换为随机分布表后连接效率低的问题,提出一种大规模并行处理数据库中哈希表的并行连接操作算法.根据共享存储环境下哈希分布表的数据块分布特性,并结合随机读取的扫描优势,利用数据多副本分布式存储提高本地读比率,且不损失数据块哈希分布的特性.TPC-H标准测试结果表明,与传统并行连接算法相比,该算法能有效提高连接操作效率,连接查询语句最高可降低30%的响应时间.
连接操作、并行连接、大规模并行处理、大数据、在线分析处理
44
TP391(计算技术、计算机技术)
国家自然科学基金青年科学基金61100020;国家自然科学基金面上项目61572373
2018-11-23(万方平台首次上网日期,不代表论文的发表时间)
共5页
24-28