DOI：10.3969/j.issn.1002-0802.2021.08.017

基于近端策略优化算法的频谱切换问题研究

引用

摘要：

针对认知无线网络(Cognitive Radio Network,CRN)中的频谱切换问题,提出了一种基于强化学习的近端策略优化(Proximal Policy Optimization,PPO)方法.首先,将频谱切换问题建模为马尔可夫决策过程,设计了一种基于用户体验质量(Quality of Experience,QoE)的回报函数.其次,通过训练算法模型使长期回报最大化,从而实现了最优频谱切换.最后,通过仿真实验对提出的切换方法进行验证.结果表明,基于PPO的频谱切换方法能够实现更高效和更稳定的切换,提高了认知用户的可用传输速率和数据交付成功率,缩短了数据交付时间.

关键词：认知无线电;频谱切换;强化学习;近端策略优化(PPO)

所属期刊栏目：54

分类号：TN929

资助基金：江苏省自然科学基金项目No.BK20160080

在线出版日期：2021-09-02（万方平台首次上网日期，不代表论文的发表时间）

页数：共8页

页码：1917-1924

英文信息展示

期刊专题