10.16451/j.cnki.issn1003-6059.201901001
基于路径积分强化学习方法的 蛇形机器人目标导向运动
路径积分方法源于随机最优控制,是一种数值迭代方法,可求解连续非线性系统的最优控制问题,不依赖于系统模型,快速收敛.文中将基于路径积分强化学习的策略改善方法用于蛇形机器人的目标导向运动.使用路径积分强化学习方法学习蛇形机器人步态方程的参数,不仅可以在仿真环境下使蛇形机器人规避障碍到达目标点,利用仿真环境的先验知识也能在实际环境下快速完成相同的任务.实验结果验证方法的正确性.
路径积分、强化学习、随机最优控制、蛇形机器人、目标导向
32
TP242.6(自动化技术及设备)
国家自然科学基金项目61603200,U1613210
2019-05-10(万方平台首次上网日期,不代表论文的发表时间)
共9页
1-9