强化学习的地-空异构多智能体协作覆盖研究
以无人机(unmanned aerial vehicle, UAV)和无人车(unmanned ground vehicle, UGV)的异构协作任务为背景,通过UAV和UGV的异构特性互补,为了扩展和改进异构多智能体的动态覆盖问题,提出了一种地–空异构多智能体协作覆盖模型.在覆盖过程中,UAV可以利用速度与观测范围的优势对UGV的行动进行指导;同时考虑智能体的局部观测性与不确定性,以分布式局部可观测马尔可夫(decentralized partially observable Markov decision pro-cesses,DEC-POMDPs) 为模型搭建覆盖场景,并利用多智能体强化学习算法完成对环境的覆盖.仿真实验表明, UAV与 UGV间的协作加快了团队对环境的覆盖速度,同时强化学习算法也提高了覆盖模型的有效性.
异构多智能体、覆盖问题、地-空、UAV/UGV、DEC-POMDPs、强化学习
13
TP181(自动化基础理论)
国家自然科学基金青年基金项目61304166
2018-04-11(万方平台首次上网日期,不代表论文的发表时间)
共6页
202-207