基于SAC强化学习的车联网频谱资源动态分配

引用

摘要：

针对车联网频谱资源稀缺问题,提出一种基于柔性致动-评价(SAC)强化学习算法的多智能体频谱资源动态分配方案.以最大化信道总容量与载荷成功交付率为目标,建立车辆-车辆(V2V)链路频谱资源分配模型.将每条V2V链路作为单个智能体,构建多智能体马尔科夫决策过程模型.利用SAC强化学习算法设计神经网络,通过最大化熵与累计奖励和以训练智能体,使得V2V链路经过不断学习优化频谱资源分配.仿真结果表明,与基于深度Q网络和深度确定性策略梯度的频谱资源分配方案相比,该方案可以更高效地完成车联网链路之间的频谱共享任务,且信道传输速率和载荷成功交付率更高.

关键词：车联网;资源分配;多智能体强化学习;柔性致动-评价算法;频谱分配

所属期刊栏目：47

分类号：TP393.1(计算技术、计算机技术)

资助基金：国家自然科学基金;中央高校基本科研业务费专项资金;江苏省自然科学青年基金

在线出版日期：2021-11-10（万方平台首次上网日期，不代表论文的发表时间）

页数：共10页

页码：34-43

英文信息展示

期刊专题