基于SARSA学习的单交叉口配时优化仿真与设计
现如今我国城市道路网络迅速扩大,城市道路交通拥挤状况加剧.传统的定时控制和感应控制不再适应交通环境的多变性、随机性及不确定性.针对Q学习算法只考虑新的状态下获得的最大奖赏,而不考虑新状态带来的风险,将Sarsa学习应用于单交叉口配时优化方法中,Sarsa学习在目标选择策略中有着既考虑最优值,又考虑探索作用值的优点.以单交叉口平均延误最小为优化目标,确定最优策略,并在VisSim中进行仿真,在仿真检验阶段1 000个步长后,Sarsa学习的车辆平均延误相比于Q学习减少了1.277 s.结果 表明Sarsa学习算法在配时优化延误指标上优于Q学习.
交叉口控制、Sarsa学习、配时优化、强化学习
39
TP301(计算技术、计算机技术)
陕西省科技厅项目;陕西省西安市未央区科技局项目
2020-09-30(万方平台首次上网日期,不代表论文的发表时间)
共5页
76-80