基于改进分层强化学习的CPS指令多目标动态优化分配算法

引用

摘要：

应用经典强化学习方法的控制性能标准(control performance standard，CPS)下自动发电控制(automatic generation control，AGC)指令(CPS指令)由调度端至电网各台机组的分配过程不可避免出现维数灾难问题。提出应用分层强化学习的方法，将全网机组按调频时延做初次分类，CPS指令逐层分配形成任务分层结构。在分层Q学习算法层与层之间引入一个时变协调因子，改进的分层Q学习算法有效提高原算法收敛速度。奖励函数中设计不同的权值线性组合，展示保守及乐观控制下系统CPS控制水平和调节成本的变化关系。南方电网统计性仿真分析表明，改进分层Q学习算法较分层Q学习算法平均收敛时间缩短47％，在复杂随机扰动的环境中改进算法能有效提高系统CPS考核合格率，并降低调节成本约5％。

关键词：分层强化学习、协调因子、随机优化、控制性能标准、自动发电控制

所属期刊栏目：31

分类号：TM71(输配电工程、电力网及电力系统)

资助基金：国家自然科学基金项目50807016；广东省自然科学基金项目9151064101000049；中央高校基本科研业务费专项资金2009ZM0251。

在线出版日期：2011-12-23（万方平台首次上网日期，不代表论文的发表时间）

页数：共7页

页码：90-96

英文信息展示

期刊专题