10.3969/j.issn.1001-5922.2021.09.035
基于确定性策略梯度算法的机械臂控制模型构建及仿真
为更好的实现对工业制造领域中机械臂的控制,结合当前的深度学习算法,提出一种改进奖励函数的DDPG机械臂控制方法.在该方法中,通过引入多奖励参数等方式,增强机械臂控制的灵活性,提高目标抓取的准确率.最后通过参数设置和DDPG网络模型构建,对改进方案进行验证.结果表明,该改进方式在目标抓取方面更具有稳定性.
DDPG算法、机械臂控制、仿真、奖励参数
47
TM359.9(电机)
2021-09-22(万方平台首次上网日期,不代表论文的发表时间)
共4页
151-154