DOI：10.3969/j.issn.1005-3026.2015.03.004

模型未知非零和博弈问题的策略迭代算法

引用

摘要：

提出了一种在线积分策略迭代算法,用来求解内部非线性动力模型未知的双人非零和博弈问题.通过在控制策略和干扰策略中引入探测信号,从而避开了系统的模型信息,得到了一个求解非零和博弈的无模型的近似动态规划算法.该算法同步更新值函数、控制策略、扰动策略,并且最终得到收敛的策略权值.在算法实现过程中,使用4个神经网络分别近似两个值函数、控制策略和扰动策略,使用最小二乘法估计神经网络的未知参数.最后仿真结果验证了算法的有效性.

关键词：自适应动态规划、非零和博弈、策略迭代、神经网络、最优控制

所属期刊栏目：36

分类号：TP183(自动化基础理论)

资助基金：国家自然科学基金资助项目61104010;高等学校博士学科点专项科研基金资助项目20110042120032

在线出版日期：2015-07-29（万方平台首次上网日期，不代表论文的发表时间）

页数：共5页

页码：318-321,326

英文信息展示

期刊专题