10.13682/j.issn.2095-6533.2023.01.012
基于多智能体强化学习的露天矿车辆调度方法
为了改善传统的基于多目标优化算法的露天矿车辆调度存在的实时性差和能耗比低的问题,提出一种基于多智能体强化学习的露天矿车辆调度方法.通过对露天矿场车辆、装载点及卸载点等相关信息的分析,构建多智能体强化学习算法所需的仿真环境.同时,基于集中式训练分布式执行范式构建一个基于社交感知的多智能体深度确定性策略梯度模型,将其作为强化学习的智能体,该模型的演员网络通过使用深度确定性策略梯度算法保证所提调度方法的稳定性.仿真结果表明,所提方法能满足露天矿车辆调度的实时调度,并且能提高能耗比.
露天矿、车辆调度、强化学习、多智能体
28
TP18(自动化基础理论)
2023-07-05(万方平台首次上网日期,不代表论文的发表时间)
共7页
104-110