10.3969/j.issn.1001-8360.2023.02.009
临时限速下基于强化学习的高速列车速度曲线优化
高速列车运行过程中受到恶劣天气、前方列车等的影响,导致线路增设临时限速,需要实时生成优化的目标速度曲线,以保障运行效率.为此,提出考虑限速信息的列车目标速度曲线优化方法.根据列车运行阶段的不同设置工况调整策略,并提出用于优化列车车载控制器的动作选择策略的最短剩余运行时间计算方法.在高速列车运行强化学习环境的状态空间中增加限速信息变量,重构了强化学习环境.基于优先回放机制改进了双深度Q网络算法,以提高算法学习效率和模型收敛速度.不同临时限速场景下的仿真算例表明双深度Q网络算法可以充分利用计划运行时间曲线与最短运行时间曲线之间的冗余,保证列车准时性的前提下实现列车节能舒适运行,与遗传算法相比,有效减少工况切换次数,同时降低列车运行能耗3%以上.
高速列车、目标速度曲线、临时限速、深度强化学习、双深度Q网络
45
TP181(自动化基础理论)
国家自然科学基金;国家自然科学基金;国家自然科学基金;北京交通大学基本科研业务费
2023-03-28(万方平台首次上网日期,不代表论文的发表时间)
共9页
84-92