10.19734/j.issn.1001-3695.2019.07.0260
基于强化学习的电动车路径优化研究
针对有路径总时长约束、载重量约束和电池容量约束的电动车路径优化问题(EVRP),考虑其途中可前往充电站充电的情境,构建以最小化路径总长度为目标的数学模型,提出一种基于强化学习的求解算法RL-EVRP.该算法用给定的分布生成训练数据,再通过策略梯度法训练模型,并保证在训练过程中路径合法即可.训练得到的模型可用于解决其他数据同分布的问题,无须重新训练.通过仿真实验及与其他算法的对比,表明RL-EVRP算法求解的路径总长度更短、车辆数更少,也表明强化学习可成功运用于较复杂的组合优化问题中.
车辆路径问题、电动车、多约束、强化学习、策略梯度法、组合优化
37
TP399(计算技术、计算机技术)
2020-12-15(万方平台首次上网日期,不代表论文的发表时间)
共4页
3232-3235