基于深度确定性策略梯度算法的双轮机器人平衡控制研究
针对深度强化学习在双轮机器人中的应用问题,提出了一种基于深度确定性策略梯度算法的平衡控制方法.首先,该方法将双轮机器人作为智能体,读取状态信息并建立动作策略和奖惩机制;其次,智能体依据算法给出的随机动作指令执行,执行完动作之后反馈状态信息,算法根据反馈的状态信息给出新动作;最后,通过多回合训练使双轮机器人保持平衡.实验结果表明,通过多回合训练之后,双轮机器人的姿态角度波动范围在-4°~4°以内,双轮机器人的平稳性得到了显著改善,实现了机器人的平衡控制行为学习,证明了该方法的有效性.
双轮机器人、平衡控制、策略梯度、动作策略、奖惩机制
TP242.6(自动化技术及设备)
国家自然基金;广东省自然科学基金;五邑大学青年科研基金
2020-04-14(万方平台首次上网日期,不代表论文的发表时间)
共3页
142-144