10.16208/j.issn1000-7024.2023.09.002
基于深度强化学习的多基站计算卸载策略
针对多个基站覆盖下的移动用户如何选择最佳的卸载策略问题,提出一种与匹配博弈论结合的双延迟深度确定性策略梯度(GT-TD3)算法来实现用户计算任务的卸载.以最小化时延及能耗为 目标提出优化问题,使用多基站博弈算法求解用户与其对应卸载基站的最佳匹配方案,使用深度强化学习算法求解系统开销最小化的优化问题.仿真结果表明,所提算法相较4种对比算法可以有效减少MEC系统总花费,为移动用户提供更高效的服务.
移动边缘计算、计算卸载、资源分配、博弈论、确定性策略梯度、深度强化学习、物联网
44
TP18;TN929.5(自动化基础理论)
陕西省自然科学基金;陕西省重点产业创新链群基金项目
2023-11-02(万方平台首次上网日期,不代表论文的发表时间)
共8页
2569-2576