基于数据的自学习优化控制:研究进展与展望

引用

摘要：

自适应动态规划(Adaptive dynamic programming,ADP)方法可以解决传统动态规划中的“维数灾”问题,已经成为控制理论和计算智能领域最新的研究热点.ADP方法采用函数近似结构来估计系统性能指标函数,然后依据最优性原理来获得近优的控制策略.ADP是一种具有学习和优化能力的智能控制方法,在求解复杂非线性系统的最优控制问题中具有极大的潜力.本文对ADP的理论研究、算法实现、相关应用等方面进行了全面的梳理,涵盖了最新的研究进展,并对ADP的未来发展趋势进行了分析和展望.

关键词：自适应动态规划、近似动态规划、强化学习、神经网络、智能控制

所属期刊栏目：39

资助基金：国家自然科学基金61034002,61233001,61273140;National Natural Science Foundation of China61034002,61233001,61273140

在线出版日期：2013-11-26（万方平台首次上网日期，不代表论文的发表时间）

页数：共13页

页码：1858-1870

英文信息展示

期刊专题