10.3969/j.issn.1006-9348.2006.04.044
内在激励强化学习及其在Robocup仿真中的应用
针对以往的强化学习对单步动作学习的效率较低,从心理学角度引入内在激励的概念, 并将其作为强化学习的激励信号, 与外部激励信号一同作用于强化学习的整个过程. 改变了传统意义上的强化学习的框架模式.在学习的过程中,不但要学习单步的动作值,同时还学连续动作的技巧值,通过构建各种"技巧",来提高解决新问题的能力,使学习的效率得到很大的提高.最后将内在激励的强化学习运用于Robocup仿真组足球比赛当中.
内在激励、强化学习、机器人足球
23
TP242(自动化技术及设备)
2006-06-08(万方平台首次上网日期,不代表论文的发表时间)
共3页
160-162