10.3969/j.issn.1002-0802.2021.08.017
基于近端策略优化算法的频谱切换问题研究
针对认知无线网络(Cognitive Radio Network,CRN)中的频谱切换问题,提出了一种基于强化学习的近端策略优化(Proximal Policy Optimization,PPO)方法.首先,将频谱切换问题建模为马尔可夫决策过程,设计了一种基于用户体验质量(Quality of Experience,QoE)的回报函数.其次,通过训练算法模型使长期回报最大化,从而实现了最优频谱切换.最后,通过仿真实验对提出的切换方法进行验证.结果表明,基于PPO的频谱切换方法能够实现更高效和更稳定的切换,提高了认知用户的可用传输速率和数据交付成功率,缩短了数据交付时间.
认知无线电;频谱切换;强化学习;近端策略优化(PPO)
54
TN929
江苏省自然科学基金项目No.BK20160080
2021-09-02(万方平台首次上网日期,不代表论文的发表时间)
共8页
1917-1924