10.3969/j.issn.1006-2475.2022.01.014
基于深度强化学习的多无人机电力巡检任务规划
无人机因其成本低、操控性强等优势,在电网线路与电塔的巡检任务中取得了广泛的应用.在大范围电网巡检任务中,单台无人机由于其续航半径有限,需要多架无人机协作完成巡检任务.传统任务规划方法存在计算速度慢、协作效果不突出等问题.针对以上问题,本文提出一种基于多智能体强化学习值混合网络(QMIX)的任务规划算法,采用集中训练、分散执行的框架,为每架无人机建立循环神经网络,并通过混合网络得到联合动作值函数指导训练.该算法通过设计任务奖赏函数以激发多智能体的协作能力,有效解决多无人机任务规划协作效率低的问题.仿真实验结果表明所提算法的任务时间相比于常用的值分解网络(VDN)算法减少了350.4 s.
强化学习;电力巡检;多智能体协作
TP399(计算技术、计算机技术)
国家自然科学基金;南京航空航天大学研究生创新基金资助项目;南京理工大学紫金学院校级科研项目
2022-03-22(万方平台首次上网日期,不代表论文的发表时间)
共5页
98-102