10.3969/j.issn.1006-9348.2016.05.085
多机器人强化学习的防碰撞方法仿真
在多机器人共同运动过程中,因机器人的运动轨迹各不相同,容易产生碰撞.由于机器人之间是独立个体,多机器人防止碰撞的协同通信过程具有不一致性和相互干扰性,互相的运动规矩无法快速为对方知晓,导致传统的防碰撞算法在多机器的应用中,防碰撞误差较大.为解决上述问题,提出基于改进分层算法的多机器人强化学习的防碰撞方法.上述方法先获取在稳定状态下机器人检测自身和目标障碍物的状态信息,将机器人的防碰撞行为分解为几个不同的子行为,同时将向目标点靠近行为融合于机器人的动态与静态两种防碰撞学习层,并计算得到机器人奖励目标函数与惩罚目标函数的加权和,以计算出的结果为核心设计出多机器人强化学习的强化函数,并在机器人的传感器检测范围内建立多机器人防碰撞加权和模型,实现了对机器人防碰撞的加强学习.仿真结果证明,改进分层算法的多机器人强化学习的防碰撞方法学习效果较为明显.
强化学习、多机器人、防避碰
33
TP242.2(自动化技术及设备)
2016-07-19(万方平台首次上网日期,不代表论文的发表时间)
共4页
389-392