DOI：10.13921/j.cnki.issn1002-5561.2023.05.003

基于改进DQN强化学习算法的弹性光网络资源分配研究

引用

摘要：

针对光网络资源分配中频谱资源利用率不高的问题,提出了一种改进的深度Q网络(DQN)强化学习算法.该算法基于ε-greedy策略,根据动作价值函数和状态价值函数的差异来设定损失函数,并不断调整ε值,以改变代理的探索率.通过这种方式,实现了最优的动作值函数,并较好地解决了路由与频谱分配问题.此外,采用了不同的经验池取样方法,以提高迭代训练的收敛速度.仿真结果表明:改进DQN强化学习算法不仅能够使弹性光网络训练模型快速收敛,当业务量为300 Erlang时,比DQN算法频谱资源利用率提高了10.09%,阻塞率降低了12.41%,平均访问时延减少了 1.27 ms.

关键词：弹性光网络、改进深度Q网络强化学习算法、资源分配

所属期刊栏目：47

分类号：TN929.1

资助基金：国家计算机网络与信息安全技术研究专项研究计划;国家自然科学基金

在线出版日期：2023-10-11（万方平台首次上网日期，不代表论文的发表时间）

页数：共4页

页码：12-15

英文信息展示

期刊专题