基于逆向强化学习的铁路线路方案优选研究

引用

摘要：

铁路线路方案评价及比选多采用组合赋权法,其主观赋权过程计算冗杂.选取具备一定程度普适性的专家案例,采用最大熵逆向强化学习方法从专家案例中学习主观赋权"知识",得到专家案例隐藏的"奖励",从而获取可解释性的主观权重.将此主观权重与离差法所得客观权重组合并投入后续TOPSIS(Technique for Order Preference by Similarity to Ideal Solution)评价流程,对线路方案进行最终评价.结合具体实例,建立设计阶段绿色铁路的评价指标体系.结果表明:该方法可以有效计算铁路线路方案评价的量化指标,减小现有赋权方法的计算复杂度,取得较好的评价效果,与真实案例比选结果一致.通过讨论该方法的适用性、局限性及原因,确定该方法在初步评价和泛用性评价中的定位.

关键词：铁路选线、方案决策、评价模型、最大熵逆向强化学习、TOPSIS、绿色铁路

所属期刊栏目：63

分类号：U212.32(铁路线路工程)

资助基金：国家自然科学基金;国家自然科学基金

在线出版日期：2023-08-23（万方平台首次上网日期，不代表论文的发表时间）

页数：共7页

页码：1-7

英文信息展示

期刊专题