基于强化学习的电动汽车换电站实时调度策略优化
随着电动汽车的应用推广,换电站的调度优化逐渐成为研究热点.传统的基于换电需求预测值的调度策略在实际应用中面临着难以适应动态干扰因素、预测误差累积等问题.为了解决这些问题,提出了一种基于带基线的蒙特卡罗策略梯度法的换电站实时调度策略,用于优化换电站的充放电策略以及响应电池数量.提出了带基线的蒙特卡罗策略梯度强化学习,并为换电站实时调度问题选取合适的状态空间和动作空间;设计了奖励函数对智能体进行离线训练,从电池状态数据、分时电价和排队电动汽车数量中学习得到最优策略网络;在离线训练好的模型基础上进行实时调度策略测试.基于换电站的服务可用率和经济效益验证了所提调度策略的有效性和经济性,算例结果表明所提策略能对电网负荷起到一定的削峰填谷作用.
电动汽车、换电站、强化学习、策略梯度、分时电价、实时调度
42
U469.72;TM734(汽车工程)
2022-10-27(万方平台首次上网日期,不代表论文的发表时间)
共8页
134-141