复杂动态环境下基于深度强化学习的AGV避障方法

引用

摘要：

为提升自动导引车(AGV)在智能工厂复杂动态环境下的避障能力,使其能在全局路径引导下安全、高效地完成避障任务,提出一种基于深度强化学习的局部避障方法.首先,将避障问题表示为部分观测马尔可夫决策过程,详细描述了观测空间、动作空间、奖励函数和最优避障策略,通过设置不同的奖励实现以全局路径引导局部避障规划;然后,在此基础上,采用深度确定性策略梯度算法训练避障策略;最后,建立了仿真实验环境,并设计多种实验场景来验证所提方法的有效性.实验结果表明,所提方法可以应对复杂动态环境,减小避障时间与距离,提高运行效率.

关键词：动态避障、深度强化学习、全局路径引导、智能工厂

所属期刊栏目：29

分类号：TH166

资助基金：国家重点研发计划;国家自然科学基金

在线出版日期：2023-02-24（万方平台首次上网日期，不代表论文的发表时间）

页数：共10页

页码：236-245

英文信息展示

期刊专题