10.3778/j.issn.1002-8331.2011.30.001
一种改进的自动分层算法BMAXQ
针对MAXQ算法存在的弊端,提出一种改进的分层学习算法BMAXQ.该方法修改了MAXQ的抽象机制,利用BP神经网络的特点,使得Agent能够自动发现子任务,实现各分层的并行学习,适应动态环境下的学习任务.
分层强化学习、MAXQ算法、BP神经网络、子任务
47
TP18(自动化基础理论)
国家自然科学基金the National Natural Science Foundation of China under Grant 60873139;山西省自然科学基金2008011040;北航虚拟现实技术与系统国家重点实验室开放课题SKVR-KF-09-04
2012-02-21(万方平台首次上网日期,不代表论文的发表时间)
共3页
1-3