基于数据的自学习优化控制:研究进展与展望
自适应动态规划(Adaptive dynamic programming,ADP)方法可以解决传统动态规划中的“维数灾”问题,已经成为控制理论和计算智能领域最新的研究热点.ADP方法采用函数近似结构来估计系统性能指标函数,然后依据最优性原理来获得近优的控制策略.ADP是一种具有学习和优化能力的智能控制方法,在求解复杂非线性系统的最优控制问题中具有极大的潜力.本文对ADP的理论研究、算法实现、相关应用等方面进行了全面的梳理,涵盖了最新的研究进展,并对ADP的未来发展趋势进行了分析和展望.
自适应动态规划、近似动态规划、强化学习、神经网络、智能控制
39
国家自然科学基金61034002,61233001,61273140;National Natural Science Foundation of China61034002,61233001,61273140
2013-11-26(万方平台首次上网日期,不代表论文的发表时间)
共13页
1858-1870