基于强化学习的边缘计算网络资源在线分配方法
针对边缘计算应用对实时性的要求,引入软件定义网络和网络功能虚拟化技术对边缘计算网络进行重构.基于此,考虑以最大化长期平均实时任务处理成功率为目标的计算和通信资源在线分配问题.通过建立马尔可夫决策过程模型,提出基于Q学习的资源在线分配方法.Q学习在状态动作空间较大时内存占用大且会发生维度灾难,鉴于此,进一步提出基于DQN的资源在线分配方法.实验结果表明,所提出算法能够较快收敛,且DQN算法相较于Q学习和其他基准方法能够获得更高的实时任务处理成功率.
边缘计算、资源分配、实时任务、马尔可夫决策过程、Q学习、深度强化学习
37
TP273(自动化技术及设备)
国家自然科学基金;浙江省自然科学基金;浙江省属高校基本科研业务费专项资金项目
2022-10-31(万方平台首次上网日期,不代表论文的发表时间)
共7页
2880-2886