10.13335/j.1000-3673.pst.2019.2572
基于多代理Double DQN算法模拟发电侧竞价行为
强化学习已经成为研究发电侧竞价策略的重要方法,而Q-Learning算法的Q-table维度问题是限制其应用在发电侧竞价策略的主要原因,为此文章采用智能多代理Double DQN (double deep q-learning network,DDQN)算法进行研究.DDQN算法采用神经网络估计值函数与选择动作策略,解决了Q-Learning会因为状态序列的增加导致计算量庞大甚至无法求解的问题.此外,文章根据日前市场发电商报价方式设计了报价策略并作为DDQN的动作空间,将发电商中标电量与负荷需求作为DDQN的状态序列,在tensorflow环境中模拟竞价过程.实验结果表明,使用DDQN算法模拟发电商竞价行为是可行的,并且参与竞价的发电商都达到了纳什均衡点.
多代理、Double DQN、神经网络、竞价行为、纳什均衡
44
TM73(输配电工程、电力网及电力系统)
国家电网有限公司科技项目“双向竞争的电力现货市场交易出清与仿真分析关键技术研究”1200-201940420A-0-0-00
2020-11-30(万方平台首次上网日期,不代表论文的发表时间)
共8页
4175-4182