基于卷积神经网络的"拱猪"博弈算法
"拱猪"又称"华牌",是一款极具特点的牌类游戏,属于非完备信息博弈,由亮牌和出牌 2 个阶段组成,整个游戏过程具有极强的反转性.为了研究"拱猪"计算机博弈算法,本文提出了一种基于深度学习的"拱猪"博弈算法,包含亮牌和出牌 2 个神经网络,分别用于亮牌和出牌阶段.亮牌和出牌网络均采用卷积神经网络(convolutional neural network,CNN)来构建,根据功能特点分别设计为不同的网络结构.采用 11 000 局人类高级玩家的真实牌谱按比例生成训练数据和测试数据,对 2 个CNN网络进行了训练、测试和分析.结果表明,亮牌和出牌网络分别达到了 88.4%和 71.4%的准确率.对亮牌和出牌的一些具体例子进行的分析表明,本文算法能够产生合理的亮牌和出牌策略.
人工智能、非完备信息博弈、深度学习、卷积神经网络、拱猪、华牌、亮牌、出牌
18
TP183;G892(自动化基础理论)
国家自然科学基金;国家自然科学基金
2023-08-28(万方平台首次上网日期,不代表论文的发表时间)
共8页
775-782