10.19399/j.cnki.tpt.2022.03.020
基于强化学习的D2D通信资源分配系统研究
D2D通信可以实现距离相近的两个设备,不需要基站中继而通过复用通信资源进行直接通信,这种方式尽管能够提高传输速率,但是用户之间存在的干扰也不能忽略.为解决这一问题,提出一种基于强化学习的D2D通信资源分配的系统,利用Q学习的方法,在动态环境下将动作-状态构建成Q值表,系统通过执行的动作产生回报值,不断更新Q值表,最终趋于收敛,获得最大化效益.系统通过Q值表选择使得利益最大化的动作执行,给蜂窝小区内的用户分配信道和功率等级,减少干扰.从仿真来看,在算法的控制下,资源利用率获得了大大提高,降低了干扰.
D2D通信、资源分配、强化学习
39
TP393.08;TP273+.1;TN929.1
江苏省高等学校大学生创新创业训练计划项目;江苏省高校自然科学研究面上项目;教育部卓越工程师教育培养计划项目产学合作协同育人项目;教育部卓越工程师教育培养计划项目产学合作协同育人项目
2022-07-04(万方平台首次上网日期,不代表论文的发表时间)
共3页
67-69