10.13700/j.bh.1001-5965.2018.0789
基于强化学习的时间触发通信调度方法
未来航空电子系统中将会更广泛地选择基于时间触发的通信机制进行信息传输,以保证信息交互的确定性.如何合理地进行时间触发通信调度设计是时间触发应用于航空电子互连系统的关键.针对时间触发调度的周期性任务,提出了一种基于强化学习的周期调度时刻表生成方法.首先,将流量调度任务转换为树搜索问题,使之具有强化学习所需要的马尔可夫特性;随后,利用基于神经网络的强化学习算法对调度表进行探索,不断缩短延迟时间以优化调度表,且在训练完成后,可以直接使用到消息分布相近的任务中.与使用Yices等可满足模理论(SMT)形式化求解时间触发调度表方法相比,所提方法不会出现无法判定的问题,能够保证时间触发调度设计结果的正确性和优化性.对于包含1000条消息的大型网络,所提方法的计算速度为SMT方法的数十倍以上,并且调度生成消息的端到端延迟在SMT方法的1% 以下,大大提高了消息传输的及时性.
时间触发、调度方法、强化学习、树搜索、偏置时间
45
V247.5;TN914(航空仪表、航空设备、飞行控制与导航)
国家自然科学基金;国家自然科学基金;中国民航大学天津市民用航空器适航与维修重点实验室开放基金
2019-10-16(万方平台首次上网日期,不代表论文的发表时间)
共8页
1894-1901