10.19678/j.issn.1000-3428.0059295
基于SAC强化学习的车联网频谱资源动态分配
针对车联网频谱资源稀缺问题,提出一种基于柔性致动-评价(SAC)强化学习算法的多智能体频谱资源动态分配方案.以最大化信道总容量与载荷成功交付率为目标,建立车辆-车辆(V2V)链路频谱资源分配模型.将每条V2V链路作为单个智能体,构建多智能体马尔科夫决策过程模型.利用SAC强化学习算法设计神经网络,通过最大化熵与累计奖励和以训练智能体,使得V2V链路经过不断学习优化频谱资源分配.仿真结果表明,与基于深度Q网络和深度确定性策略梯度的频谱资源分配方案相比,该方案可以更高效地完成车联网链路之间的频谱共享任务,且信道传输速率和载荷成功交付率更高.
车联网;资源分配;多智能体强化学习;柔性致动-评价算法;频谱分配
47
TP393.1(计算技术、计算机技术)
国家自然科学基金;中央高校基本科研业务费专项资金;江苏省自然科学青年基金
2021-11-10(万方平台首次上网日期,不代表论文的发表时间)
共10页
34-43