结合先验知识与蒙特卡罗模拟的麻将博弈研究
针对内陆麻将缺乏统一平台和大量牌谱数据,难以设计出基于监督学习的博弈算法的问题,本文设计了一系列将规则、经验与蒙特卡罗方法相结合的博弈算法.首先,分别针对麻将博弈的弃牌模块、听牌模块、吃牌模块提出了弃牌优先级、听牌有效数、吃牌优先级的方法,完善了麻将AI的知识体系,设计了基础版博弈算法Fanfou_ba和优化版博弈算法Fanfou_op;其次,提出了利用蒙特卡罗方法模拟听牌对手手牌来降低己方点炮概率的提升版博弈算法Fanfou_mc;最后,将3种博弈算法进行对比实验.实验结果显示Fanfou_op相比Fan-fou_ba胜率提高了9.76%,Fanfou_mc相比Fanfou_op胜率提高了0.13%且点炮率降低了0.47%,表明本文所提出的改进策略是可行并有效的.
麻将;博弈;先验知识;蒙特卡罗;对手手牌;模拟;点炮;胜率
17
TP18(自动化基础理论)
辽宁省兴辽英才计划项目XLYC1906003
2022-02-17(万方平台首次上网日期,不代表论文的发表时间)
共10页
69-78