基于元强化学习的自动列车定速控制
本文考虑自动列车在路况变化下的定速控制问题.由于铁路路况的复杂以及列车动力学的不确定性,基于模型的控制器难以稳定、快速、精确地进行定速控制.提出了一种无模型控制器,其只需要很少的列车运行数据即可适应新的路况.首先,本文将列车的定速控制问题建模为一系列转移概率未知的静态连续马尔可夫过程.然后,应用元强化学习去求解该马尔可夫过程,得到自适应神经网络控制器.仿真说明该无模型控制器能够高效地进行定速控制,并能迅速适应新的环境,同时满足系统约束.
定速控制、马尔可夫过程、强化学习、元学习、神经网络
39
TP273;TP183;O211.62
国家自然科学基金62033006
2023-03-07(万方平台首次上网日期,不代表论文的发表时间)
共8页
1807-1814