10.3969/j.issn.1006-9348.2023.01.080
基于深度强化学习的多智能体动态寻路算法
针对目前多智能体寻路领域中存在的路线单一、易拥堵、易碰撞等问题,提出了一种基于全连接神经网络的近端策略优化算法.智能体利用射线作为其观测值,将收集到的观测值传人全连接神经网络中提取特征,近端策略优化算法根据所提取特征决定智能体下一个动作,通过不断训练,从而达到寻路目的.针对稀疏奖励问题,使用好奇心驱动和生成对抗性模仿学习完成训练.在Unity引擎进行仿真的结果证明,所提算法与Unity提供的NavMesh(导航网格)相比,在简单与复杂场景中均可实现更智能、更合理的多智能体动态寻路.
深度强化学习、多智能体、动态寻路、近端策略优化、好奇心驱动、模仿学习
40
TP391.9(计算技术、计算机技术)
国家自然科学基金;山西自然科学基金资助项目;山西省研究生教育创新项目
2023-03-01(万方平台首次上网日期,不代表论文的发表时间)
共7页
441-446,473