通信资源调度对称MARL问题策略估计误差分析
针对通信资源调度场景下的多智能体强化学习(MARL)问题,提出了对称MARL问题以及三类对称性的定义和条件,并定义了策略融合和策略误差;针对强对称MARL问题,定义了三类评价指标,并对策略估计误差进行分析,提出了强对称MARL问题的策略误差定理及推论.针对无线通信的接入控制问题建立了MARL问题,仿真结果验证了强对称MARL问题策略估计误差的特性.结果表明,可以使用低复杂度的MARL子问题对高复杂度的强对称MARL问题进行策略估计,且策略估计误差和对网络性能的影响均较小.
强化学习、对称多智能体强化学习、策略估计
42
TN929.53
国家自然科学基金项目61471066
2019-08-19(万方平台首次上网日期,不代表论文的发表时间)
共6页
1-6