10.3969/j.issn.1673-629X.2023.01.018
基于强化学习的异构超密度网络资源分配算法
为了保证下行链路用户服务质量(Quality of Service,QoS),提升异构超密度网络的频谱利用率(Spectrum Efficient,SE)和能源效率(Energy-Efficient,EE),提出了一种基于多智能体强化学习(Deep Reinforcement Learning,DRL)的频谱和功率联合分配算法.首先,以频谱利用率和能源效率为优化目标,用户服务质量为约束,得到资源分配优化函数.然后定义多智能体用户状态空间,奖励以及动作空间,通过较小的通信开销获得状态空间信息,得到一维状态空间数据,减少网络的输入数据量,用户利用自身的信道状态信息(Channel State Information,CSI)而不依赖全局信道状态信息,再根据状态空间信息得到频谱和功率分配策略.最后,通过训练深度神经网络找到最佳的资源分配策略.仿真结果表明,该算法可以实现较快的收敛速度,对比贪婪算法以及其他强化学习方法,能源效率均提升20%以上,频谱利用率分别提升27%和11%.
异构超密度网络、强化学习、资源分配、功率分配、用户服务质量
33
TP39(计算技术、计算机技术)
国家自然科学基金;中国科学院重点实验室开放基金
2023-02-20(万方平台首次上网日期,不代表论文的发表时间)
共8页
114-120,129