10.19949/j.ams.mora.20220707.01
基于历史回报引导探索策略的机器人智能博弈对抗研究
针对作战机器人在异构对称场景下战场环境探索不充分、不优化的问题,提出一种基于历史回报引导深度强化学习的探索策略,将元参数学习的思想应用于深度强化学习中超参数的学习,引导智能体进行探索.研究历史回报与探索策略之间的关系,提出在线学习的探索策略构建方法;将提出的基于历史回报引导探索策略应用于作战机器人博弈对抗任务中,辅助深度强化学习决策模型快速生成博弈对抗策略,优化了作战机器人在实时异构对称场景中的博弈策略.
异构对称、智能博弈对抗、深度强化学习、历史回报、探索策略
38
E911;TP319(军事技术基础科学)
2023-07-04(万方平台首次上网日期,不代表论文的发表时间)
共5页
42-46