基于马尔可夫决策过程的电动汽车充电站能量管理策略
电动汽车充电站作为并网分布式储能装置,是实现电动汽车与未来能源互联网深度融合的重要组成部分.考虑分时电价和电动汽车用户行为的不确定性,提出了以电动汽车充电站日运营成本最小化为目标的能量管理策略.为了减少对先验信息的依赖和约束,将优化问题建模为一个新的有限回合马尔可夫决策过程模型;基于传统成本模型提出奖惩回报函数,通过主动学习调度决策,得到每辆电动汽车的实时充放电行为;针对模型的高维状态空间问题,设计相应的状态空间和动作空间,采用一种卷积神经网络结构结合强化学习的方法,通过从原始数据观测中提取高质量的经验,获取最优调度策略以达到优化目标.仿真结果表明,与传统的充电策略相比,所提策略可以有效地降低充电站的日运营成本,保护电动汽车的电池,同时能满足电动汽车用户的充电需求.
电动汽车、充电站、充电规划、马尔可夫决策过程、能量管理、深度强化学习
42
U469.72;TM73(汽车工程)
国家自然科学基金;国家自然科学基金;国家科技攻关计划
2022-10-27(万方平台首次上网日期,不代表论文的发表时间)
共8页
92-99