DOI：10.11992/tis.202012038

基于强化学习的参数自整定及优化算法

引用

摘要：

传统PID控制算法在非线性时滞系统的应用中,存在参数整定及性能优化过程繁琐、控制效果不理想的问题.针对该问题,提出了一种基于强化学习的控制器参数自整定及优化算法.该算法引入系统动态性能指标计算奖励函数,通过学习周期性阶跃响应的经验数据,无需辨识被控对象模型的具体数据,即可实现控制器参数的在线自整定及优化.以水箱液位控制系统为实验对象,对不同类型的PID控制器使用该算法进行参数整定及优化的对比实验.实验结果表明,相比于传统的参数整定方法,所提出的算法能省去繁琐的人工调参过程,有效优化控制器参数,减少被控量的超调量,提升控制器动态响应性能.

关键词：强化学习、整定、优化、学习算法、时滞、控制器、液位控制、动态响应

所属期刊栏目：17

分类号：TP273(自动化技术及设备)

资助基金：深圳市知识创新计划JCYJ20170818144449801

在线出版日期：2022-04-28（万方平台首次上网日期，不代表论文的发表时间）

页数：共7页

页码：341-347

英文信息展示

期刊专题