基于深度强化学习的无人艇集群博弈对抗
开展基于深度强化学习的无人艇集群动态博弈对抗中的协同围捕决策研究.建立受距离和相对角度影响的无人艇围捕环境模型,利用基于策略网络和双评价网络的深度强化学习方法求解围捕策略,立足协同围捕任务,基于距离和相对角度设计引导型奖励函数,避免奖励稀疏.仿真结果表明,基于深度强化学习的红方无人艇集群能够对蓝方无人艇进行有效的协同围捕.研究成果可为无人艇集群博弈对抗演练提供参考.
无人艇集群、博弈对抗、深度强化学习、协同围捕
43
TP24(自动化技术及设备)
国家自然科学基金52271302
2022-11-07(万方平台首次上网日期,不代表论文的发表时间)
共6页
9-14