10.3969/j.issn.1001-506X.2012.01.18
基于RBF神经网络的Q学习飞行器隐蔽接敌策略
基于马尔科夫决策过程框架研究了三维空间内隐蔽接敌策略的强化学习方法,定义了环境模型中的优势区域和暴露区域.针对高维状态空间策略学习所面临的维数灾问题,给出基于径向基神经网络(radial basis function neural network,RBFNN)的Q学习算法,说明了训练样本的分级采样方法,并针对不同情况下的接敌机动策略学习进行了仿真分析.仿真结果表明,借助于合理的分级采样方法,基于RBFNN的Q学习算法能有效生成隐蔽接敌策略.
强化学习、隐蔽接敌、马尔科夫决策过程、动态规划、空战决策
34
TP242(自动化技术及设备)
航空科学基金20095196012资助课题
2012-05-15(万方平台首次上网日期,不代表论文的发表时间)
共5页
97-101