基于多智能体协同强化学习的多目标追踪方法

引用

摘要：

针对现有多目标追踪方法通常存在学习速度慢、追踪效率低及协同追踪策略设计困难等问题,提出一种改进的多目标追踪方法.基于追踪智能体和目标智能体数量及其环境信息建立任务分配模型,运用匈牙利算法根据距离效益矩阵对其进行求解得到多个追踪智能体的任务分配情况,并以缩短目标智能体的追踪路径为优化目标进行任务分工,同时利用多智能体协同强化学习算法使多个智能体在相同环境中不断重复执行探索-积累-学习-决策过程,最终根据经验数据更新策略完成多目标追踪任务.仿真结果表明,与DDPG和MADDPG方法相比,该方法能在避免碰撞和躲避障碍物的情况下,使多个智能体通过相互协作形成针对多个运动目标的最短追踪路线.

关键词：多智能体、多目标追踪、强化学习、任务分配、实时性

所属期刊栏目：46

分类号：TP391.1(计算技术、计算机技术)

资助基金：广东省应用型科技研发基金2016B010127005

在线出版日期：2021-01-26（万方平台首次上网日期，不代表论文的发表时间）

页数：共7页

页码：90-96

英文信息展示

期刊专题