10.3969/j.issn.1674-5825.2020.06.011
基于深度强化学习算法的空间漂浮基机械臂抓捕控制策略
针对空间漂浮基座机械臂抓捕非合作目标控制所基于的多体系统动力学模型难以精确建立的问题,基于深度强化学习算法的控制策略,提出一种深度确定性规则策略.通过将机械臂关节控制力矩、抓捕距离以及相对速度等参数定义为高维空间向量,并设置对应的奖励函数,驱动目标参数逼近满足抓捕条件的数值范围,在不依赖运动学模型和动力学模型的情况下,实现对非合作目标的快速逼近和抓捕.仿真算例表明:该控制算法可实现对空间漂浮基机械臂的快速抓捕控制,且能有效降低接触碰撞力的大小,提高抓捕成功率.
DRL算法、空间漂浮基机械臂、非合作目标、抓捕控制策略、奖励函数
26
V47(航天器及其运载工具)
国家自然科学基金 U1737207,11672093
2021-01-13(万方平台首次上网日期,不代表论文的发表时间)
共7页
751-757