DOI：10.3969/j.issn.1674-8425(z).2022.12.015

一种结合策略价值网络的五子棋自博弈方法研究

引用

摘要：

针对传统蒙特卡洛树搜索算法存在"难以在节点的探索和利用之间做出平衡;难以聚焦重要搜索分支"等问题,提出使用策略价值网络完成棋局评估与落子着法生成,将策略价值网络与蒙特卡洛树搜索相结合.策略价值网络指导搜索树的展开,搜索结果用以持续更新网络参数,形成一种自博弈方法,在多轮自博弈中实现算法的迭代优化.实验表明:相较于各种经典搜索算法,所提算法在平均落子时间上降低了约95％,平均对局胜率达到80％以上.

关键词：蒙特卡洛树搜索、深度神经网络、五子棋计算机博弈、自博弈

所属期刊栏目：36

分类号：TP301(计算技术、计算机技术)

资助基金：国家自然科学基金60443004

在线出版日期：2023-02-15（万方平台首次上网日期，不代表论文的发表时间）

页数：共7页

页码：129-135

英文信息展示

期刊专题