10.13873/J.1000-9787(2023)01-0038-05
基于势能与好奇心机制的室内环境导航研究
研究了深度强化学习(DRL)方法在室内环境下移动机器人导航策略中的路径规划问题.针对外部奖励稀疏使得机器人难以完成导航任务的问题,设计了基于势能的外部奖励函数;针对机器人易陷入奖励局部极小值所引发的次优策略下最大奖励过早收敛问题,引入基于内在好奇心模块(ICM)内部奖励作为奖励增强信号,并结合近端策略优化(PPO)算法在ROS和Gazebo搭建的室内装修仿真环境下作对比实验.实验结果表明:添加了外部势能奖励函数和好奇心内部奖励的PPO模型在仿真环境中表现出了良好的性能.
深度强化学习、室内环境、移动机器人、外部奖励、内部奖励
42
TP249(自动化技术及设备)
国家自然科学基金U1813202
2023-02-15(万方平台首次上网日期,不代表论文的发表时间)
共5页
38-42