双足机器人步态控制的深度强化学习方法
针对双足机器人行走过程中的步态稳定控制问题,提出一种改进深度Q网络的深度强化学习方法.首先,将深度Q网络算法与确定性策略梯度相结合,提出用修正Double-Q网络优化操作一评论网络的评论网络,给出一种改进的深度Q网络;然后,建立双足机器人连杆模型,在常规的平整路面上将改进的深度Q网络用于作为智能体的双足机器人进行步态控制训练.MATLAB仿真结果表明,与深度Q网络和深度确定性策略梯度算法相比,所提算法有更好的训练速度且其回报曲线具有良好的平滑性.在CPU训练下,经过20 h左右深度强化学习能够完成智能体训练.双足机器人在较小的力矩和长距离下能够稳定快步行走.
双足机器人;步态控制;深度强化学习;智能体;操作—评论;改进深度Q网络算法
27
TP242.6(自动化技术及设备)
国家自然科学基金青年基金资助项目;2018年江苏省青蓝工程优秀青年骨干教师资助项目
2021-10-22(万方平台首次上网日期,不代表论文的发表时间)
共9页
2341-2349