10.3969/j.issn.1002-137X.2013.08.052
XCSG在多机器人强化学习中的应用
XCS分类器在解决机器人强化学习方面已显示出较强的能力,但在多机器人领域仅局限于MDP环境,只能解决环境空间较小的学习问题.提出了XCSG来解决多机器人的强化学习问题.XCSG建立低维的逼近函数,梯度下降技术利用在线知识建立稳定的逼近函数,使Q表格一直保持在稳定低维状态.逼近函数Q不仅所需的存储空间更小,而且允许机器人在线对已获得的知识进行归纳一般化.仿真实验表明,XCSG算法很好地解决了多机器人学习空间大、学习速度慢、学习效果不确定等问题.
强化学习、多机器人、学习分类器、梯度下降法的学习分类器
40
TP181(自动化基础理论)
国家自然科学基金90820004
2013-10-10(万方平台首次上网日期,不代表论文的发表时间)
共4页
249-251,292