基于深度强化学习的无人艇集群博弈对抗

引用

摘要：

开展基于深度强化学习的无人艇集群动态博弈对抗中的协同围捕决策研究.建立受距离和相对角度影响的无人艇围捕环境模型,利用基于策略网络和双评价网络的深度强化学习方法求解围捕策略,立足协同围捕任务,基于距离和相对角度设计引导型奖励函数,避免奖励稀疏.仿真结果表明,基于深度强化学习的红方无人艇集群能够对蓝方无人艇进行有效的协同围捕.研究成果可为无人艇集群博弈对抗演练提供参考.

关键词：无人艇集群、博弈对抗、深度强化学习、协同围捕

所属期刊栏目：43

分类号：TP24(自动化技术及设备)

资助基金：国家自然科学基金52271302

在线出版日期：2022-11-07（万方平台首次上网日期，不代表论文的发表时间）

页数：共6页

页码：9-14

英文信息展示

期刊专题