10.3969/j.issn.1001-8360.2020.01.010
一种基于策略梯度强化学习的列车智能控制方法
近年来,我国已初步建成巨大的城市轨道交通和高速铁路网络,逐步开始走向提升整体运营效率的新阶段.城市轨道交通系统的大规模和高密度运营,使得系统能耗急剧增长.现有的自动驾驶控制方法基于已有的模型,能够完成在正常场景下的自动驾驶.基于现有列车自动驾驶技术的控制原理和优秀司机的驾驶经验,提出一种列车智能控制方法,以减小列车的牵引能耗.首先,建立列车控制专家系统,能满足乘客舒适度要求;在此基础上,利用神经网络作为列车驾驶控制器,设计了一种基于策略的强化学习算法,优化神经网络的参数,以适应变化的运营场景.基于地铁现场运行数据仿真结果表明,该智能算法比现有算法具有更好地节能效果和准时性.
轨道交通、节能运行、强化学习、专家系统
42
U283.1(铁路通信、信号)
国家自然科学基金;中国国家铁路集团有限公司科技研究开发计划
2020-03-31(万方平台首次上网日期,不代表论文的发表时间)
共7页
69-75