10.16668/j.cnki.issn.1003-1421.2023.08.06
基于强化学习的货物列车长大下坡区段运行控制优化算法
针对货物列车在长大下坡道运行时需要采用循环制动方式进行调速,以及空气制动需要满足最小充风时间的特点,基于强化学习理论,研究其在长大下坡区段的最优操纵策略.建立多质点的列车动力学模型,将提高列车运行效率和减少制动盘损耗作为优化目标,在区间限速、最低缓解速度、最小充风时间等多种约束条件下,提出基于Q学习的强化学习优化算法;将列车运行状态和列车操纵动作进行离散化,建立基于状态-动作有限界的Q值查询表,通过不断更新状态转移空间的Q值对算法进行训练;以SS6B型机车作为研究对象进行仿真,在不同入坡速度、区段限速和出坡限速条件下,算法能够通过采用空气制动的方式将列车运行速度控制在限速以下,从而实现货物列车在长大下坡的运行曲线优化,验证算法的收敛性和有效性.
货物列车、长大下坡、运行控制、强化学习、多目标优化、Q学习算法
45
U260(机车工程)
中国铁道科学研究院集团有限公司通信信号研究所科研项目;中国国家铁路集团有限公司科技研究开发计划;中国铁道科学研究院集团有限公司科研项目
2023-08-17(万方平台首次上网日期,不代表论文的发表时间)
共7页
36-42