结合深度强化学习与领域知识的电力系统拓扑结构优化
对拓扑结构进行优化可提高电力系统运行灵活性,然而线路开断与变电站母线分裂等系统级的离散决策变量维度极高.该拓扑结构优化问题难以由传统混合整数优化方法求解.针对该问题,提出了一种结合异步优势Actor-Critic(A3C)深度强化学习与电力系统领域知识的运行优化方法,将在线优化的计算负担转移至离线智能体训练阶段.该方法通过同时考虑拓扑结构与发电出力调整的动作空间设计系统运行控制智能体,以最小化约束越限为训练奖励,通过强制约束校验缩减搜索空间并提高强化学习效率,从而实现电力系统运行拓扑结构优化的快速计算,提高电力系统运行的安全性.仿真测试验证了所提方法的有效性.
电力系统运行;深度强化学习;拓扑结构优化;发电出力调整
46
TP181;TP319;TM732
2022-01-13(万方平台首次上网日期,不代表论文的发表时间)
共9页
60-68