基于分布式深度强化学习的微电网实时优化调度
随着海量新能源接入到微电网中,微电网系统模型的参数空间成倍增长,其能量优化调度的计算难度不断上升.同时,新能源电源出力的不确定性也给微电网的优化调度带来巨大挑战.针对上述问题,本文提出了一种基于分布式深度强化学习的微电网实时优化调度策略.首先,在分布式的架构下,将主电网和每个分布式电源看作独立智能体.其次,各智能体拥有一个本地学习模型,并根据本地数据分别建立状态和动作空间,设计一个包含发电成本、交易电价、电源使用寿命等多目标优化的奖励函数及其约束条件.最后,各智能体通过与环境交互来寻求本地最优策略,同时智能体之间相互学习价值网络参数,优化本地动作选择,最终实现最小化微电网系统运行成本的目标.仿真结果表明,与深度确定性策略梯度算法(DDPG)相比,本方法在保证系统稳定以及求解精度的前提下,训练速度提高了 17.6%,成本函数值降低了67%,实现了微电网实时优化调度.
强化学习、分布式优化、微电网、优化调度、优化算法
39
TM732;TP18;TP301.6
国家自然科学基金;浙江省钱江人才特殊急需类项目
2023-03-07(万方平台首次上网日期,不代表论文的发表时间)
共9页
1881-1889