10.3969/j.issn.1673-629X.2015.02.026
大数据环境下数据读取关键技术研究
针对大数据环境下数据读取面临的主要挑战,文中重点研究了分布式文件系统中数据读取关键技术。根据数据存放结构的不同,从数据加载、查询处理和存储空间利用三个方面分析比较行存储、列存储和行列混合存储的优缺点和面临的挑战,重点介绍列存储中涉及到的压缩和物化技术,具体分析了存储压缩中经常运用的行程编码算法、词典编码算法、位向量编码算法和元组重构中运用的延迟物化技术。通过分析现有技术存在的问题,探讨相关的解决方案,并展望了未来研究的发展方向。
大数据、列存储、压缩、物化技术
TP31(计算技术、计算机技术)
国家自然科学基金资助项目60973140,61170276,61373135;江苏省产学研项目BY2013011;江苏省科技型企业创新基金项目BC2013027;江苏省高校自然科学研究重大项目12KJA520003
2015-03-25(万方平台首次上网日期,不代表论文的发表时间)
共4页
113-116