基于Q网络的磁悬浮自学习控制系统设计
针对现有磁悬浮控制系统设计方法依赖动力学模型的问题,利用Q网络强化学习方法,在不依赖系统模型的条件下,训练得到基于Q网络的自学习控制器;基于系统运动方向设计奖励函数,提高了强化学习训练的收敛速度;提出了基于系统加权平均状态(weighted average states,WAS)的训练算法,自适应调节每回合的训练步数,以提高控制网络的有效控制范围.数值仿真结果表明,基于WAS算法的Q网络自学习控制器能够实现磁悬浮系统的稳定控制,对比普通的强化学习算法,能够实现系统更大范围的稳定控制.
磁悬浮系统;无模型;强化学习;Q网络;加权平均状态
25
TP273.2(自动化技术及设备)
国家自然科学基金61304006
2021-10-14(万方平台首次上网日期,不代表论文的发表时间)
共8页
132-139