DOI：10.11992/tis.201609017

强化学习的地-空异构多智能体协作覆盖研究

引用

摘要：

以无人机(unmanned aerial vehicle, UAV)和无人车(unmanned ground vehicle, UGV)的异构协作任务为背景,通过UAV和UGV的异构特性互补,为了扩展和改进异构多智能体的动态覆盖问题,提出了一种地–空异构多智能体协作覆盖模型.在覆盖过程中,UAV可以利用速度与观测范围的优势对UGV的行动进行指导;同时考虑智能体的局部观测性与不确定性,以分布式局部可观测马尔可夫(decentralized partially observable Markov decision pro-cesses,DEC-POMDPs) 为模型搭建覆盖场景,并利用多智能体强化学习算法完成对环境的覆盖.仿真实验表明, UAV与 UGV间的协作加快了团队对环境的覆盖速度,同时强化学习算法也提高了覆盖模型的有效性.

关键词：异构多智能体、覆盖问题、地-空、UAV/UGV、DEC-POMDPs、强化学习

所属期刊栏目：13

分类号：TP181(自动化基础理论)

资助基金：国家自然科学基金青年基金项目61304166

在线出版日期：2018-04-11（万方平台首次上网日期，不代表论文的发表时间）

页数：共6页

页码：202-207

英文信息展示

期刊专题