10.19942/j.issn.2096-5915.2023.01.06
基于深度强化学习和导航向量场的卫星规避拦截算法
针对在轨卫星规避拦截问题,提出了一种新的基于强化学习和三维李雅普诺夫导航向量场(3D-LGV)算法.首先,采用3D-LGV产生收敛于椭圆轨道的趋近律,保证规避拦截后能再次入轨.其次,针对拦截卫星利用扰动流体动态系统算法(IFDS)产生扰动流场,利用该扰动流场对导航向量场产生的趋近律进行修正,从而保证卫星能有效地规避拦截.由于IFDS算法中扰动流场大小和方向主要受其中反应系数和方向系数的影响,采用近端策略优化深度强化学习算法作为决策层输出反应系数和方向系数,用于指导卫星在不同场景下提供合适的对导航向量场的修正.最后,通过将IFDS算法修正后的趋近律作为卫星的最终运动方向,实现了整个规避过程.在构建的不同场景下进行了对比实验,结果表明,相较于滚动时域优化算法(RHC)、人工势场算法(APF)和传统IFDS算法,基于强化学习的算法决策时间更短、规避效果更好,在不同场景下均能实现有效规避.同时,对该算法进行蒙特卡洛仿真,统计结果显示卫星规避成功率高达98%.因此,此研究对智能方法在卫星规避拦截领域的应用具有一定价值.
规避拦截、李雅普诺夫导航向量场、扰动流体动态系统、近端策略优化、强化学习、智能决策
6
V249.3(航空仪表、航空设备、飞行控制与导航)
国家自然科学基金;国家自然科学基金;中国博士后科学基金
2023-03-27(万方平台首次上网日期,不代表论文的发表时间)
共10页
62-71