基于价值分解深度强化学习的分布式光伏主动电压控制方法

引用

摘要：

针对主动电压控制问题,深度强化学习能够有效地解决数学优化方法在精确性和实时性方面的不足.但传统多智能体深度强化学习方法存在信用分配、过度泛化等问题,难以学习到全局最优的协调策略,控制效果较差.为此,提出了一种基于价值分解深度强化学习的分布式光伏主动电压控制方法.将主动电压控制问题建模为分布式部分可观测马尔可夫决策过程,然后基于中心化训练和去中心化执行框架,提出分解式价值网络、集中式策略梯度2项改进措施:将全局价值网络分解为个体价值网络和混合网络,并采用所有智能体的当前策略进行集中参数更新.改进的IEEE 33节点配电网系统的算例结果表明,所提方法表现出了优越的稳压减损控制性能,且在训练速度、场景鲁棒性等方面具备一定的优势.

关键词：主动电压控制、分布式光伏、深度强化学习、多智能体、价值分解、集中式策略梯度

所属期刊栏目：43

分类号：TM73(输配电工程、电力网及电力系统)

在线出版日期：2023-10-23（万方平台首次上网日期，不代表论文的发表时间）

页数：共8页

页码：152-159

英文信息展示

期刊专题