10.13921/j.cnki.issn1002-5561.2023.05.003
基于改进DQN强化学习算法的弹性光网络资源分配研究
针对光网络资源分配中频谱资源利用率不高的问题,提出了一种改进的深度Q网络(DQN)强化学习算法.该算法基于ε-greedy策略,根据动作价值函数和状态价值函数的差异来设定损失函数,并不断调整ε值,以改变代理的探索率.通过这种方式,实现了最优的动作值函数,并较好地解决了路由与频谱分配问题.此外,采用了不同的经验池取样方法,以提高迭代训练的收敛速度.仿真结果表明:改进DQN强化学习算法不仅能够使弹性光网络训练模型快速收敛,当业务量为300 Erlang时,比DQN算法频谱资源利用率提高了10.09%,阻塞率降低了12.41%,平均访问时延减少了 1.27 ms.
弹性光网络、改进深度Q网络强化学习算法、资源分配
47
TN929.1
国家计算机网络与信息安全技术研究专项研究计划;国家自然科学基金
2023-10-11(万方平台首次上网日期,不代表论文的发表时间)
共4页
12-15