复杂动态环境下基于深度强化学习的AGV避障方法
为提升自动导引车(AGV)在智能工厂复杂动态环境下的避障能力,使其能在全局路径引导下安全、高效地完成避障任务,提出一种基于深度强化学习的局部避障方法.首先,将避障问题表示为部分观测马尔可夫决策过程,详细描述了观测空间、动作空间、奖励函数和最优避障策略,通过设置不同的奖励实现以全局路径引导局部避障规划;然后,在此基础上,采用深度确定性策略梯度算法训练避障策略;最后,建立了仿真实验环境,并设计多种实验场景来验证所提方法的有效性.实验结果表明,所提方法可以应对复杂动态环境,减小避障时间与距离,提高运行效率.
动态避障、深度强化学习、全局路径引导、智能工厂
29
TH166
国家重点研发计划;国家自然科学基金
2023-02-24(万方平台首次上网日期,不代表论文的发表时间)
共10页
236-245