DOI：10.19734/j.issn.1001-3695.2019.07.0260

基于强化学习的电动车路径优化研究

引用

摘要：

针对有路径总时长约束、载重量约束和电池容量约束的电动车路径优化问题(EVRP),考虑其途中可前往充电站充电的情境,构建以最小化路径总长度为目标的数学模型,提出一种基于强化学习的求解算法RL-EVRP.该算法用给定的分布生成训练数据,再通过策略梯度法训练模型,并保证在训练过程中路径合法即可.训练得到的模型可用于解决其他数据同分布的问题,无须重新训练.通过仿真实验及与其他算法的对比,表明RL-EVRP算法求解的路径总长度更短、车辆数更少,也表明强化学习可成功运用于较复杂的组合优化问题中.

关键词：车辆路径问题、电动车、多约束、强化学习、策略梯度法、组合优化

所属期刊栏目：37

分类号：TP399(计算技术、计算机技术)

在线出版日期：2020-12-15（万方平台首次上网日期，不代表论文的发表时间）

页数：共4页

页码：3232-3235

英文信息展示

期刊专题