10.3969/j.issn.2095-2163.2020.04.003
基于强化学习的苏拉卡尔塔博弈算法
本文探讨了基于蒙特卡洛方法的强化学习博弈程序的原理,基于该原理结合BP算法设计了一个进行自学习的苏拉卡尔塔博弈程序.实验证明,该方法能让智能体不断的学习提高棋力,避免了繁琐的手工构建静态评估函数过程.
强化学习、计算机博弈、苏拉卡尔塔棋、人工神经网络
10
TP18(自动化基础理论)
北京信息科技大学2019年促进高校内涵发展-大学生科研训练项目5101923400
2020-08-20(万方平台首次上网日期,不代表论文的发表时间)
共4页
6-8,12