10.3969/j.issn.1672-3767.2013.03.004
一种基于优势更新的机器人平衡控制算法
针对自平衡机器人运动平衡控制问题,提出了一种基于优势更新的强化学习机制作为机器人的自平衡仿生学习算法.该算法利用优势更新中的基线,结合强化学习中的概率好奇心机制,以一定的概率选择优等行为,剔除劣等行为,从而使机器人在未知环境下可获得像生物一样的自主学习技能,实现机器人的仿生自平衡运动控制.最后,应用该算法对机器人进行自平衡的仿真实验.结果表明,这种基于优势更新的强化学习算法能使机器人获得较强的平衡控制技能,取得了较好的动态性能,体现了机器人的仿生特性.
优势更新、强化学习、好奇心、仿生、机器人
32
TP242.6(自动化技术及设备)
国家自然科学基金项目61203343
2013-08-01(万方平台首次上网日期,不代表论文的发表时间)
共5页
17-21