基于深度强化学习的多小区NOMA能效优化功率分配算法
在下行多小区非正交多址接入系统中,功率分配是决定系统性能的关键因素之一.由于多小区系统间的功率优化问题的非凸性,获得最优功率分配在求解上非常困难.为此提出了一种基于深度强化学习最大化能效的功率分配算法,将深度Q网络作为动作?状态值函数,将系统能效直接设置为奖励函数,优化信道功率分配,使系统能量效率最大化.仿真结果表明,该算法比加权最小均方误差、分式规划、最大功率和随机功率算法等能够获得更高的系统能量效率,在算法计算复杂度、收敛速度和稳定性方面也有较好表现.
深度Q网络、能量效率、非正交多址接入、功率分配、强化学习
51
TN911.22
国家自然科学基金;国家自然科学基金;安徽省教育厅自然科学基金
2022-06-01(万方平台首次上网日期,不代表论文的发表时间)
共8页
384-391