基于深度确定性策略梯度的虚拟网络功能迁移优化算法
针对NFV/SDN架构下,服务功能链(SFC)的资源需求动态变化引起的虚拟网络功能(VNF)迁移优化问题,该文提出一种基于深度强化学习的VNF迁移优化算法.首先,在底层CPU、带宽资源和SFC端到端时延约束下,建立基于马尔可夫决策过程(MDP)的随机优化模型,该模型通过迁移VNF来联合优化网络能耗和SFC端到端时延.其次,由于状态空间和动作空间是连续值集合,提出一种基于深度确定性策略梯度(DDPG)的VNF智能迁移算法,从而得到近似最优的VNF迁移策略.仿真结果表明,该算法可以实现网络能耗和SFC端到端时延的折中,并提高物理网络的资源利用率.
虚拟网络功能、深度强化学习、SFC端到端时延、网络能耗
43
TN929.5
国家自然科学基金;重庆市教委科学技术研究项目;重庆市重大主题专项项目
2021-03-05(万方平台首次上网日期,不代表论文的发表时间)
共8页
404-411