在策略 SARSA 算法在互联电网 CPS 最优控制中的应用
CPS 标准下的互联电网的自动发电控制(AGC)系统是一个典型的不确定随机系统,提出一种新型应用于 AGC 系统的随机最优控制策略——基于 SARSA 算法的互联电网 CPS 最优控制策略.SARSA 算法更多地考虑控制策略动作的花费,倾向于避开进入随机系统中搜索一些危险的状态,相对于离策略(off-policy)的 Q 学习算法,在策略(on-policy)SARSA 算法的学习试错过程中对受控系统影响更小.仿真结果表明,基于 SARSA 算法的 CPS 控制器较 Q 学习算法有更好的鲁棒性和适应性,能够获得更佳的 CPS 指标.
随机控制、自动发电控制、CPS 标准、SARSA 算法、强化学习
TM76(输配电工程、电力网及电力系统)
2013-01-29(万方平台首次上网日期,不代表论文的发表时间)
共6页
211-216