基于改进的DDPG算法的蛇形机器人路径规划方法
万方数据知识服务平台
应用市场
我的应用
会员HOT
万方期刊
×

点击收藏,不怕下次找不到~

@万方数据
会员HOT

期刊专题

10.7535/hbkd.2023yx02007

基于改进的DDPG算法的蛇形机器人路径规划方法

引用
针对蛇形机器人执行路径规划任务时,面对复杂环境传统强化学习算法出现的训练速度慢、容易陷入死区导致收敛速度慢等问题,提出了一种改进的深度确定性策略梯度(deep determin-istic policy gradient,DDPG)算法.首先,在策略-价值(actor-critic)网络中引入多层长短期记忆(long short-term memory,LSTM)神经网络模型,使其控制经验池中信息的记忆和遗忘程度;其次,通过最优化特征参数将 CPG(central pattern generators)网络融入强化学习模型,并设计新型网络状态空间和奖励函数;最后,将改进算法与传统算法分别部署在 Webots 环境中进行仿真实验.结果表明,相比于传统算法,改进算法整体训练时间平均降低了 15%,到达目标点迭代次数平均降低了 22%,减少了行驶过程中陷入死区的次数,收敛速度也有明显的提升.因此所提算法可以有效地引导蛇形机器人躲避障碍物,为其在复杂环境下执行路径规划任务提供了新的思路.

机器人控制、蛇形机器人、改进的DDPG算法、强化学习、CPG网络、Webots三维仿真

44

TP242.6(自动化技术及设备)

国家自然科学基金;河北省重点研发计划项目

2023-05-17(万方平台首次上网日期,不代表论文的发表时间)

共12页

165-176

相关文献
评论
暂无封面信息
查看本期封面目录

河北科技大学学报

1008-1542

13-1225/TS

44

2023,44(2)

相关作者
相关机构

专业内容知识聚合服务平台

国家重点研发计划“现代服务业共性关键技术研发及应用示范”重点专项“4.8专业内容知识聚合服务技术研发与创新服务示范”

国家重点研发计划资助 课题编号:2019YFB1406304
National Key R&D Program of China Grant No. 2019YFB1406304

©天津万方数据有限公司 津ICP备20003920号-1

信息网络传播视听节目许可证 许可证号:0108284

网络出版服务许可证:(总)网出证(京)字096号

违法和不良信息举报电话:4000115888    举报邮箱:problem@wanfangdata.com.cn

举报专区:https://www.12377.cn/

客服邮箱:op@wanfangdata.com.cn