基于多智能体深度强化学习的D2D通信资源联合分配方法
设备对设备(D2D)通信作为一种短距离通信技术,能够极大地减轻蜂窝基站的负载压力和提高频谱利用率.然而将D2D直接部署在授权频段或者免授权频段必然导致与现有用户的严重干扰.当前联合部署在授权和免授权频段的D2D通信的资源分配通常被建模为混合整数非线性约束的组合优化问题,传统优化方法难以解决.针对这个挑战性问题,该文提出一种基于多智能体深度强化学习的D2D通信资源联合分配方法.在该算法中,将蜂窝网络中的每个D2D发射端作为智能体,智能体能够通过深度强化学习方法智能地选择接入免授权信道或者最优的授权信道并发射功率.通过选择使用免授权信道的D2D对(基于"先听后说"机制)向蜂窝基站的信息反馈,蜂窝基站能够在非协作的情况下获得WiFi网络吞吐量信息,使得算法能够在异构环境中执行并能够确保WiFi用户的QoS.与多智能体深度Q网络(MADQN)、多智能体Q学习(MAQL)和随机算法相比,所提算法在保证WiFi用户和蜂窝用户的QoS的情况下能够获得最大的吞吐量.
D2D通信、先听后说、免授权频段长期演进、资源分配、多智能体强化学习
45
TN929.5
国家科技重大专项;国家自然科学基金;重庆成渝科技创新项目
2023-05-06(万方平台首次上网日期,不代表论文的发表时间)
共10页
1173-1182