一种网络编码分布式存储系统中的数据更新策略
网络编码作为一种具有高可靠性和低冗余等优点的存储方案而被引入到分布式存储系统中,但是其数据更新过程的开销却很大.一些更新方案为了减少I/O开销而引入Log-based存储机制,而没有考虑优化网络带宽使用量.本文中,通过分析多个数据集,发现了大部分更新数据块存在着多次更新的情况,针对这一现象,我们提出一种更新方案CUM,利用网络编码的线性特性和更新节点的缓存区域,将更新块和校验块的信息缓存起来,当数据块多次更新时则可以直接在缓存中读取信息来计算新的校验块,从而减少了到存储节点上读取数据的带宽使用量.本文在NCFS的基础上建立缓存更新模型,并在真实的数据集上对CUM进行测试.实验结果显示CUM相比当前广泛使用的Differential Update Model(DUM)在更新性能上有很大改进,带宽使用量减少最多达总量的30%,更新时间最多减少24.57%,更新速度最多提高1.326倍.
网络编码、分布式存储系统、再生码、缓存、数据更新
38
TP301(计算技术、计算机技术)
国家自然科学基金项目61572232,61272073;广东省自然科学基金重点项目S2013020012865;中国科学院计算机系统结构国家重点实验室开放基金项目CARCH201401U资助;中央高校基本科研业务费专项资金
2017-08-22(万方平台首次上网日期,不代表论文的发表时间)
共6页
645-650