10.3969/j.issn.1001-3695.2008.04.004
分层强化学习研究进展
首先介绍了半马尔可夫决策过程、分层与抽象等分层强化学习的理论基础;其次,较全面地比较HAM、options、MAXQ和HEXQ四种典型的学习方法,从典型学习方法的拓展、学习分层、部分感知马尔可夫决策过程、并发和多agent合作等方面讨论分层强化学习的研究现状;最后指出分层强化学习未来的发展方向.
分层强化学习、半马尔可夫决策过程、抽象
25
TP18(自动化基础理论)
广东省自然科学基金06029281;05011905
2008-05-26(万方平台首次上网日期,不代表论文的发表时间)
共5页
974-978