10.3873/j.issn.1000-1328.2022.09.005
基于深度强化学习的复杂地形适应机器人设计与实验
针对行星表面轻量化自主探测任务,基于仿生思想设计了一种仿海胆结构的十二足球形机器人,其具备自主改变构型以贴合复杂地形的能力,可实现无倾覆、高容错的全向运动;基于数据驱动方法,对该机器人设计了一种数据高效的无模型强化学习运动策略,可实现无先验知识的从0到1步态训练以及步态的实物样机快速部署.通过在平面地形和非结构化地形中对其进行仿真实验,验证了经过训练的机器人具备自主运动、适应非结构地形等能力;通过与常用基准策略进行对比,证实了本文提出的运动策略具有训练高效、鲁棒性好的优势;最后通过开发原理样机,开展实物实验验证了仿真环境中所生成的步态在真实物理环境中的动力学可行性.
仿生机器人、强化学习、复杂地形、自主运动策略、行星探测
43
TP242(自动化技术及设备)
国家优秀青年科学基金项目12022212
2022-10-27(万方平台首次上网日期,不代表论文的发表时间)
共10页
1176-1185