基于深度强化学习的配电网多时间尺度在线无功优化
含分布式电源的配电网存在潮流建模不精确、通信条件差、各无功补偿设备难以协调等问题,给配电网在线无功优化带来了挑战.文中采用深度强化学习方法,提出了一种多时间尺度配电网在线无功优化运行方案.该方案将配电网在线无功优化问题转化为马尔可夫决策过程.鉴于不同无功补偿设备的调节速度不同,设计2个时间尺度分别对离散调节设备和连续调节设备进行优化配置.该方案能够实时追踪配电网状态,在线决策无功调节设备的优化方案,且不依赖精确的潮流模型,适用于复杂多变、通信条件差的部分可观测配电网.最后,通过算例验证了所提方法的有效性和鲁棒性.
配电网、深度强化学习、马尔可夫决策过程、网络损耗、多时间尺度无功优化
45
国家自然科学基金青年科学基金项目;本文在撰写过程中得到上海市科技创新行动计划资助项目;上海市人民保险局优秀人才基金项目"自动需求响应接口设计与开发"
2021-05-25(万方平台首次上网日期,不代表论文的发表时间)
共9页
77-85