大用户直购中基于Q学习算法的多代理两阶段谈判策略
利用多代理对大用户直购电中不同类型交易者的谈判行为进行了模拟,采取基于历史报价数据的Q学习算法增加了代理的自主学习能力,使代理能根据对手动作及时调整己方报价.此外,为保证市场竞争的公平性,提出了基于"谈判+拍卖"的两阶段谈判机制,给予因对谈判形势估计不足致使谈判破裂但又拥有成本优势的发电商再一次出价的机会,使得合同电价反映出不同发电成本问的真实差异,以此激励发电商以降低成本的方式来换取谈判中的主动权.
一对多谈判、Q学习算法、电力市场、大用户直购电、双边合同
34
TM7;F40
教育部新世纪优秀人才支持计划资助项目NCET-08-0207;教育部科学技术研究重点资助项目109128;国家社会科学基金资助项目04CJL012
2011-12-12(万方平台首次上网日期,不代表论文的发表时间)
共5页
37-41