Skinner操作条件反射的一种仿生学习算法与机器人控制
针对两轮自平衡机器人的运动平衡控制问题,提出了基于Skinner操作条件反射理论的BP神经网络与资格迹相结合的仿生自主学习算法作为两轮机器人的学习机制.该算法利川资格迹能解决延迟影响、加快学习速度和提高可靠性的特点,将其与BP神经网络相结合构成复合学习算法,能够预测机器人将要获得的行为评价函数,并依据概率取向机制以一定的概率选择最人评价值对应的最优行为,从而使机器人能够在未知环境下通过与环境的交互、学习和训练,获得像人或动物一样的自主学习技能,实现对两轮机器人的运动平衡控制.最后,分别用基于Skinner操作条件反射理论的BP算法和BP资格迹复合算法对两轮机器人做了仿真实验并进行了比较.结果表明,基于Skinner操作条件反射理论的BP资格迹复合仿生自主学习算法的学习机制能够使机器人获得良好的动态性能和较快的学习速度,体现了机器人较强的自主学习技能和、平衡控制能力.
Skinner操作条件反射、资格迹、自主学习、平衡控制、两轮机器人
32
TP391(计算技术、计算机技术)
国家863计划资助项目2007AA04Z226;国家自然科学基金资助项目60774077;北京市教委重点资助项目KZ200810005002;北京市人才强教计划项目;高等学校博士学科点专项科研基金
2010-04-12(万方平台首次上网日期,不代表论文的发表时间)
共6页
132-137