兵棋推演的智能决策技术与挑战
近年来,以人机对抗为途径的智能决策技术取得了飞速发展,人工智能(Artificial intelligence,AI)技术AlphaGo、AlphaStar等分别在围棋、星际争霸等游戏环境中战胜了顶尖人类选手.兵棋推演作为一种人机对抗策略验证环境,由于其非对称环境决策、更接近真实环境的随机性与高风险决策等特点,受到智能决策技术研究者的广泛关注.通过梳理兵棋推演与目前主流人机对抗环境(如围棋、德州扑克、星际争霸等)的区别,阐述了兵棋推演智能决策技术的发展现状,分析了当前主流技术的局限与瓶颈,对兵棋推演中的智能决策技术研究进行了思考,期望能对兵棋推演相关问题中的智能决策技术研究带来启发.
兵棋推演、人机对抗、智能决策技术、博弈学习
49
G350;TP393.08;B82-02
国家自然科学基金61906197
2023-05-29(万方平台首次上网日期,不代表论文的发表时间)
共16页
913-928