10.3969/j.issn.1673-1409.2017.21.009
基于深度增强学习的自动游戏方法
增强学习近年来多被用于智能体自动游戏,但增强学习在面对过大的状态或者行动空间时不能很好地处理.深度增强学习结合深度学习的感知能力和增强学习的决策能力,可以有效解决环境复杂问题.将增强学习与深度学习结合,通过改进的Markov决策过程逐步学习最优策略.首先找到目前的环境中最有价值的状态,从而产生最大积累奖励的行动,然后通过利用深度增强学习方法训练计算机自动完成一个简单游戏,使用控制变量法分别分析迭代次数和游戏难易程度对游戏得分的影响.试验结果表明,在外界环境相同时,准确率随着试验迭代次数的增大或游戏难度的减弱而增大,从而验证了智能体可以通过外界因素的改变进行更有效训练,最终获取最优结果.
深度增强学习、自动游戏、智能体
14
TP391.4(计算技术、计算机技术)
国家自然科学基金项目61503047;长江大学大学生创新创业训练计划项目2016123
2018-04-28(万方平台首次上网日期,不代表论文的发表时间)
共5页
40-44