面向多用户动态频谱接入的改进双深度Q网络方法研究
随着移动通信技术的飞速发展,有限的频谱利用资源与大量频谱通信需求之间的矛盾也日益加剧,需要新的智能方法来提高频谱利用率.本文提出了一种基于分布式优先经验池结合双深度Q网络的多用户动态频谱接入方法.通过该方法,次用户可以在动态变化的认知无线网络环境下根据自己感知信息来不断地学习,选择空闲信道完成频谱接入任务来提高频谱利用率.该方法采用分布式强化学习框架,将每个次用户视为一个智能体,各个智能体采用标准单智能体强化学习方法进行学习以降低底层计算开销.另外,该方法在神经网络训练的基础上加入优先级采样,优化了神经网络的训练效率以帮助次用户选择出最优策略.仿真实验结果表明该方法能提高接入信道时的成功率、降低碰撞率和提升通信速率.
动态频谱接入、分布式强化学习、优先经验池、深度强化学习
40
TN929.5
国家自然科学基金61971147
2023-08-08(万方平台首次上网日期,不代表论文的发表时间)
共9页
85-93