10.3969/j.issn.1009-6744.2015.01.011
基于强化学习的汇流瓶颈区可变限速策略研究
为提高高速公路汇流瓶颈区的通行效率,本文结合强化学习无需建立模型,具有智能学习的特点,对瓶颈区的可变限速策略进行了优化,首次提出了基于Q学习算法的可变限速控制策略。策略以最大化系统总流出车辆数为目标,通过遍历交通流状态集合,尝试不同限速值序列进行自适应学习。以真实路段交通流数据搭建了元胞传输模型仿真平台,通过将其与无控制和基于反馈控制的可变限速策略进行对比,对Q学习策略的控制效果进行评价。通行时间的降低和交通参数的变化表明,强化学习控制策略在提高汇流瓶颈区通行效率和改善交通流运行状况方面具有优越性。
智能交通、可变限速、强化学习、高速公路汇流瓶颈区、Q学习算法
U491(交通工程与公路运输技术管理)
国家自然科学基金资助项目51322810
2015-03-25(万方平台首次上网日期,不代表论文的发表时间)
共7页
55-61