面向MapReduce计算模式的中间数据通信优化
万方数据知识服务平台
应用市场
我的应用
会员HOT
万方期刊
×

点击收藏,不怕下次找不到~

@万方数据
会员HOT

期刊专题

10.11772/j.issn.1001-9081.2017092358

面向MapReduce计算模式的中间数据通信优化

引用
针对MapReduce计算模式在Map阶段结束后会产生海量中间数据,导致存在大量跨越机架交换机的数据通信问题,提出一种优化Map密集型作业的中间数据通信优化方法.首先,提取MapReduce计算作业的运行前调度信息的特征并且量化数据通信活跃度;然后,采用朴素贝叶斯分类模型实现分类预测,将历史作业的运行数据作为样本来训练分类模型;最后,根据作业分类预测结果把通信活跃的作业集中映射到同一机架中,通过提高通信局部性来优化性能瓶颈.实验结果表明,所提方案对Shuffle子过程稠密的作业优化效果明显,能够提高4%~5%的计算性能;此外,在多用户运行情况下能降低4.1%中间数据通信延迟.所提方法可有效降低大数据计算过程中的通信延迟,提高异构集群的计算性能.

MapReduce计算模型、大数据处理、通信优化、中间数据、机器学习

38

TP302.7(计算技术、计算机技术)

山东省自然科学基金资助项目ZR2017MF050,ZR2015FL014;山东省高等学校科学技术计划项目J17KA049;山东省自主创新及成果转化专项2014ZZCX02702;山东省重点研发项目2016GGX109001.This work is partially supported by the Natural Science Foundation of Shandong ProvinceZR2017MF050,ZR2015FL014;the Higher Educational Science and Technology Program of Shandong ProvinceJ17KA049;the Independent Innovation and Achievements Transformation Special Project of Shandong Province2014ZZCX02702;the Primary Research and Development Project of Shandong Province2016GGX109001

2018-06-01(万方平台首次上网日期,不代表论文的发表时间)

共6页

1078-1083

相关文献
评论
暂无封面信息
查看本期封面目录

计算机应用

1001-9081

51-1307/TP

38

2018,38(4)

相关作者
相关机构

专业内容知识聚合服务平台

国家重点研发计划“现代服务业共性关键技术研发及应用示范”重点专项“4.8专业内容知识聚合服务技术研发与创新服务示范”

国家重点研发计划资助 课题编号:2019YFB1406304
National Key R&D Program of China Grant No. 2019YFB1406304

©天津万方数据有限公司 津ICP备20003920号-1

信息网络传播视听节目许可证 许可证号:0108284

网络出版服务许可证:(总)网出证(京)字096号

违法和不良信息举报电话:4000115888    举报邮箱:problem@wanfangdata.com.cn

举报专区:https://www.12377.cn/

客服邮箱:op@wanfangdata.com.cn