10.19734/j.issn.1001-3695.2022.06.0334
基于注意力机制的深度强化学习交通信号控制
深度强化学习(DRL)广泛应用于具有高度不确定性的城市交通信号控制问题中,但现有的DRL交通信号控制方法中,仅仅使用传统的深度神经网络,复杂交通场景下其感知能力有限.此外,状态作为强化学习的三要素之一,现有方法中的交通状态也需要人工精心的设计.因此,提出了一种基于注意力机制(attention mecha-nism)的DRL交通信号控制算法.通过引入注意力机制,使得神经网络自动地关注重要的状态分量以增强网络的感知能力,提升了信号控制效果,并减少了状态向量设计的难度.在SUMO(simulation of urban mobility)仿真平台上的实验结果表明,在单交叉口、多交叉口中,在低、高交通流量条件下,仅仅使用简单的交通状态,与三种基准信号控制算法相比,所提算法在平均等待时间、行驶时间等指标上都具有最好的性能.
注意力机制、深度强化学习、交通信号控制、深度Q网络、SUMO
40
TP181(自动化基础理论)
国家自然科学基金;南京航空航天大学研究生创新基地实验室开放基金资助项目
2023-03-07(万方平台首次上网日期,不代表论文的发表时间)
共5页
430-434