通信资源调度对称MARL问题策略估计误差分析

引用

摘要：

针对通信资源调度场景下的多智能体强化学习(MARL)问题,提出了对称MARL问题以及三类对称性的定义和条件,并定义了策略融合和策略误差;针对强对称MARL问题,定义了三类评价指标,并对策略估计误差进行分析,提出了强对称MARL问题的策略误差定理及推论.针对无线通信的接入控制问题建立了MARL问题,仿真结果验证了强对称MARL问题策略估计误差的特性.结果表明,可以使用低复杂度的MARL子问题对高复杂度的强对称MARL问题进行策略估计,且策略估计误差和对网络性能的影响均较小.

关键词：强化学习、对称多智能体强化学习、策略估计

所属期刊栏目：42

分类号：TN929.53

资助基金：国家自然科学基金项目61471066

在线出版日期：2019-08-19（万方平台首次上网日期，不代表论文的发表时间）

页数：共6页

页码：1-6

英文信息展示

期刊专题