10.3969/j.issn.1001-8360.2023.08.004
基于多智体强化学习的高效率货物列车运行动态调整方法
为高效降低货物列车延误的影响,提出基于多智能体强化学习的大规模列车运行计划动态调整方法.与单智能体算法显著不同,该方法提出将上行列车和下行列车设计为两个独立的智能体,进行独立学习与竞争,从而大幅度降低运行计划动态调整的算法复杂度.实验结果表明:对于N列货物列车,算法复杂度以指数函数趋势从O(2N)降低到O[2(1+N/2)],计算效率以指数函数趋势提高了2(N/2-1)倍.以包头—神木铁路万南场—东胜区段为场景(包含22列货物列车和9个车站),测试并统计不同延误扰动下动态调整优化结果:该多智能体方法将计算时间降低至但智能体方法的1%以下.尤其是针对大规模运行计划动态调整(22列车),该多智能体方法基于通用计算机仍可快速获得优化结果,而单智能体方法因计算时间过大(超过3 000 d)而无法完成任务.该多智能体强化学习方法对于大规模场景的高效和实时货物列车运行计划动态调整具有重要理论意义和应用价值.
运行计划动态调整、多智体强化学习、货物列车、计算效率、算法复杂度
45
U292.4;U294.1(铁路运输管理工程)
国家重点研发计划2017YFB1200700
2023-09-15(万方平台首次上网日期,不代表论文的发表时间)
共9页
27-35