10.16182/j.issn1004731x.joss.21-0879
基于DQN的异构测控资源联合调度方法
以异构测控网资源联合调度为研究对象,提出一种基于强化学习的深度Q网络(deep Q network,DQN)算法.在充分分析异构测控资源联合调度问题特点后,用数学语言对影响问题求解的约束条件进行描述,建立了资源联合调度模型;从应用强化学习解决问题的角度,对求解的问题进行马尔科夫决策过程描述后,分别设计了2个结构相同的神经网络和基于ε贪婪算法的动作选择策略,并建立了DQN求解框架.仿真结果表明:基于DQN的异构测控资源调度方法较遗传算法能够找到调度收益更优的测控调度方案.
航天测控、异构测控资源联合调度、深度Q网络、调度收益、强化学习
35
TP273+.1(自动化技术及设备)
2023-02-22(万方平台首次上网日期,不代表论文的发表时间)
共12页
423-434