10.3969/j.issn.1000-3428.2014.10.009
实时数据仓库中一种改进的数据流更新算法
为实现数据仓库中数据的高效集成,针对数据偏斜分布现象,提出一种改进的数据流更新算法EH-JOIN。该算法对传统散列连接方法进行改进,利用索引将部分频繁使用的主数据存储在内存中,解决了高速数据流下的磁盘频繁访问问题。实验结果表明,与MESHJOIN算法和R-MESHJOIN算法相比,EH-JOIN算法的服务速率在磁盘存储关系集保持适当大小时分别提高了96%和81%,在内存大小不同时提高了57%和48%。
实时数据仓库、数据转换、数据流更新、基于流的连接、哈希索引、偏斜分布
TP311.13(计算技术、计算机技术)
湖南省自然科学基金资助项目2011FJ3034。
2014-10-31(万方平台首次上网日期,不代表论文的发表时间)
共5页
43-46,51