10.16413/j.cnki.issn.1007080x.2017.11.003
基于MDP的多Agent生产线动态调度策略
针对车间生产线动态任务分配问题,以马尔科夫决策过程理论为基础,建立多Agent生产线的动态任务调度数学模型.系统中Agent状态、任务的出现和收益值均服从概率分布.基于马尔科夫决策过程理论,被改进的值迭代寻优算法以在限定时间内车间生产线执行任务最大收益值为目标.在寻找最大收益值的同时,值迭代寻优算法将在所有可选决策集合中确定任务分配策略.车间仿真计算通过随机任务分配策略和基于马尔科夫任务分配策略的比较,验证了算法的有效性.
生产线调度、多Agent系统、马尔科夫决策过程、值迭代算法
23
国家自然科学基金71601144
2018-05-07(万方平台首次上网日期,不代表论文的发表时间)
共6页
15-19,56