基于多代理Double DQN算法模拟发电侧竞价行为

引用

摘要：

强化学习已经成为研究发电侧竞价策略的重要方法,而Q-Learning算法的Q-table维度问题是限制其应用在发电侧竞价策略的主要原因,为此文章采用智能多代理Double DQN (double deep q-learning network,DDQN)算法进行研究.DDQN算法采用神经网络估计值函数与选择动作策略,解决了Q-Learning会因为状态序列的增加导致计算量庞大甚至无法求解的问题.此外,文章根据日前市场发电商报价方式设计了报价策略并作为DDQN的动作空间,将发电商中标电量与负荷需求作为DDQN的状态序列,在tensorflow环境中模拟竞价过程.实验结果表明,使用DDQN算法模拟发电商竞价行为是可行的,并且参与竞价的发电商都达到了纳什均衡点.

关键词：多代理、Double DQN、神经网络、竞价行为、纳什均衡

所属期刊栏目：44

分类号：TM73(输配电工程、电力网及电力系统)

资助基金：国家电网有限公司科技项目“双向竞争的电力现货市场交易出清与仿真分析关键技术研究”1200-201940420A-0-0-00

在线出版日期：2020-11-30（万方平台首次上网日期，不代表论文的发表时间）

页数：共8页

页码：4175-4182

英文信息展示

期刊专题