10.13700/j.bh.1001-5965.2019.0448
基于CGAN的避扰通信决策网络离线式训练方法
基于强化学习的避扰通信,由于需要不断地与环境交互从中学习到最优决策,其决策网络的训练时间受环境反馈速率的约束,通常耗时严重.针对这一问题,提出了一种离线式训练方法.构建出一种频谱虚拟环境生成器,可以快速生成大量的逼真合成频谱瀑布图,用于避扰通信决策网络训练.由于所提方法脱离真实环境反馈,形成离线式训练,进而显著提高模型训练效率.实验结果表明:与实时在线训练方法比较,所提离线式训练方法的训练时间可以减少50%以上.
强化学习、避扰通信、频谱瀑布图、条件生成对抗网络(CGAN)、离线式训练
46
TN974;TP181
2020-08-13(万方平台首次上网日期,不代表论文的发表时间)
共10页
1412-1421