数据中心网络高效数据汇聚传输算法
万方数据知识服务平台
应用市场
我的应用
会员HOT
万方期刊
×

点击收藏,不怕下次找不到~

@万方数据
会员HOT

期刊专题

10.11897/SP.J.1016.2016.01750

数据中心网络高效数据汇聚传输算法

引用
在数据中心中,类 MapReduce 的分布式计算系统在数据的混洗阶段产生巨大流量,令数据中心的东西向网络资源成为瓶颈.将这些高度相关的数据流在接收端进行聚合是分布式计算的通用处理方式,为了降低网络通信量并有效利用带宽,文中采用网内关联性流量的汇聚传输策略,将混洗和汇聚并行化,达到进一步降低东西向网络资源消耗、缩短混洗阶段延迟的目的.目前提出的 IRS-based 算法在适用场景上有一定局限性,为了解决这一问题,文中首先在以服务器为中心的代表结构 BCube 上建立 incast 最小树模型,分别提出 MIB-based 算法和MC-based 算法,仅根据已知拓扑结构和发送节点编号即可快速生成一棵近似的最小代价 incast 树.MIB-based 算法针对发送节点强关联的情况,使高层发送节点尽可能汇聚到已有的低层发送节点构建 incast 树;MC-based 算法针对发送节点松散关联的情况,将节点进行最大程度上的聚合,通过增加最少的汇聚点完成 incast 树的构建.随后将上述两种算法结合起来进一步提出适用于各种场景的 M2-based 算法,通过推算时间复杂度证明该算法能够满足在线构建 incast 树的需求.最后,详细分析了 M2-based 算法对其他数据中心网络结构的适应性以及网内汇聚传输能够减少作业完成时间的原理.小规模实验结果表明,在不同网络规模下,M2-based 比 IRS-based 节省了网络中约3%的数据量,整个作业在混洗和 Reduce 阶段的等待时间比不采用网内汇聚缩短约2/3;在不同传输节点规模下,M2-based 比 IRS-based 节省了网络中约19%的数据量,整个作业在混洗和 Reduce 阶段的等待时间比不采用网内汇聚缩短约3/4.

数据中心、数据汇聚、网内聚合、混洗传输、incast树

39

TP393(计算技术、计算机技术)

国家“九七三”重点基础研究发展规划项目青年科学家专题项目2014CB347800;国家自然科学基金优秀青年基金61422214;国家自然科学基金91430214;国家“八六三”高技术研究发展计划项目基金2013AA01A213资助.

2016-10-14(万方平台首次上网日期,不代表论文的发表时间)

共13页

1750-1762

相关文献
评论
暂无封面信息
查看本期封面目录

计算机学报

0254-4164

11-1826/TP

39

2016,39(9)

相关作者
相关机构

专业内容知识聚合服务平台

国家重点研发计划“现代服务业共性关键技术研发及应用示范”重点专项“4.8专业内容知识聚合服务技术研发与创新服务示范”

国家重点研发计划资助 课题编号:2019YFB1406304
National Key R&D Program of China Grant No. 2019YFB1406304

©天津万方数据有限公司 津ICP备20003920号-1

信息网络传播视听节目许可证 许可证号:0108284

网络出版服务许可证:(总)网出证(京)字096号

违法和不良信息举报电话:4000115888    举报邮箱:problem@wanfangdata.com.cn

举报专区:https://www.12377.cn/

客服邮箱:op@wanfangdata.com.cn