10.13335/j.1000-3673.pst.2021.2399
基于多主体博弈和强化学习的多微网系统协同优化研究
面向分属于不同投资和运营主体的多个冷热电联供型微网构成的多微网系统,该文提出了一种基于多主体博弈的多微网系统协同优化方法,通过博弈论建立多微网系统的协同优化模型,实现各个微网的利益均衡.针对该模型Nash均衡求解困难的问题,提出了一种改进的Nash-Q学习算法.该算法采用深度神经网络来拟合Nash-Q学习算法中的价值函数,不仅有效解决了Nash-Q学习算法直接应用于复杂环境时遇到的维数灾难问题,并且保证了算法的后效性,能快速完成合理有效的在线优化.实验结果表明,相较于传统数学规划方法和贪婪算法,改进的Nash-Q学习算法能够学习到Nash均衡策略,实现各微网间电能互补,降低各微网的运行成本,验证了所提模型和算法的有效性.
多微网系统、协同优化、博弈论、强化学习、Nash-Q
46
TM721(输配电工程、电力网及电力系统)
国家自然科学基金;国家自然科学基金;广州市科技计划
2022-07-20(万方平台首次上网日期,不代表论文的发表时间)
共11页
2722-2732