10.11772/j.issn.1001-9081.2014.11.3227
基于Hadoop的三队列作业调度算法
Hadoop集群单队列作业调度会产生短作业等待、资源利用率低的问题;采用多队列调度可兼顾公平、提高执行效率,但会带来手工配置参数、资源互占、算法复杂等问题.针对上述问题,提出三队列作业调度算法,利用区分作业类型、动态调整作业优先级、配置共享资源池、作业抢占等设计,达到平衡作业需求、简化一般作业调度流程、提升并行执行能力的目的.对短作业占比高,各作业占比均衡以及一般作业为主,偶尔出现长、短作业三种情况与先进先出(FIFO)算法进行了对比实验,结果三队列算法的运行时间均比FIFO算法要少.实验结果表明,在短作业聚集时,三队列算法的执行效率提升并不显著;但当各种作业并存且分布均衡时,效果很明显,这符合了算法设计时短作业优先、一般作业简化流程、兼顾长作业的初衷,提高了作业整体执行效率.
Hadoop、作业调度、三队列、共享资源池、作业抢占
34
TP301.6;TP393.027(计算技术、计算机技术)
国家自然科学基金资助项目61202136;江苏省高校自然科学研究项目13KJD520007;南京晓庄学院科学研究项目2012NXY14,2013NXY99
2015-01-21(万方平台首次上网日期,不代表论文的发表时间)
共5页
3227-3230,3240