DOI：10.16451/j.cnki.issn1003-6059.201901001

基于路径积分强化学习方法的蛇形机器人目标导向运动

引用

摘要：

路径积分方法源于随机最优控制,是一种数值迭代方法,可求解连续非线性系统的最优控制问题,不依赖于系统模型,快速收敛.文中将基于路径积分强化学习的策略改善方法用于蛇形机器人的目标导向运动.使用路径积分强化学习方法学习蛇形机器人步态方程的参数,不仅可以在仿真环境下使蛇形机器人规避障碍到达目标点,利用仿真环境的先验知识也能在实际环境下快速完成相同的任务.实验结果验证方法的正确性.

关键词：路径积分、强化学习、随机最优控制、蛇形机器人、目标导向

所属期刊栏目：32

分类号：TP242.6(自动化技术及设备)

资助基金：国家自然科学基金项目61603200,U1613210

在线出版日期：2019-05-10（万方平台首次上网日期，不代表论文的发表时间）

页数：共9页

页码：1-9

英文信息展示

期刊专题