D2D通信中基于深度强化学习的资源分配
设备到设备(D2D)通信能够以蜂窝设施为基础来提高资源利用率、用户吞吐量和节省电池能量.在D2D网络中,模式选择和资源分配是关键问题.为了提高D2D通信的和速率与频谱利用效率,提出一种联合模式选择、功率和资源块分配的方案.首先根据用户地理位置选定模式选择标准,帮助用户选择相应的通信模式;然后针对复用通信模式,使用基于深度强化学习的异步优势动作评价(A3C)算法为不同的D2D用户分配资源块和功率.仿真结果表明,本文提出的基于A3C算法的联合优化方案收敛速度快,并且性能相对于其他算法较好.
模式选择、功率分配、资源分配、D2D通信、深度强化学习
45
TN929.5
国家自然科学基金;网络与交换技术国家重点实验室北京邮电大学开放课题资助项目
2023-04-13(万方平台首次上网日期,不代表论文的发表时间)
共9页
76-84