基于强化学习的航空兵认知行为模型
航空兵的认知行为模型为仿真航空兵的空战决策提供支持,通过强化学习积累战术决策经验.在虚拟战场环境中,作战态势通过多个属性进行描述,这使得强化学习过程将面临一个高维度的问题空间.传统的空间离散化方法处理高维空间时将对计算资源和存储资源产生极大需求,因此不可用.通过构造一个基于高斯径向基函数的拟合网络解决了这个问题,大大减少了对资源的需求以及强化学习周期,并最终产生了合理的机动策略.模型的有效性和自适应性通过一对一的空战仿真进行了验证,产生的交战轨迹与人类飞行员产生的交战轨迹类似.
强化学习、自适应系统、仿真
36
TP391.9(计算技术、计算机技术)
装备预研重点基金资助项目9140A04040106HT0801
2017-01-18(万方平台首次上网日期,不代表论文的发表时间)
共5页
379-383