10.13700/j.bh.1001-5965.2021.0529
基于深度强化学习与扩展卡尔曼滤波相结合的交通信号灯配时方法
深度Q学习网络(DQN)因具有强大的感知能力和决策能力而成为解决交通信号灯配时问题的有效方法,然而外部环境扰动和内部参数波动等原因导致的参数不确定性问题限制了其在交通信号灯配时系统领域的进一步发展.基于此,提出了一种DQN与扩展卡尔曼滤波(EKF)相结合(DQN-EKF)的交通信号灯配时方法.以估计网络的不确定性参数值作为状态变量,包含不确定性参数的目标网络值作为观测变量,结合过程噪声、包含不确定性参数的估计网络值和系统观测噪声构造EKF系统方程,通过EKF的迭代更新求解,得到DQN模型中的最优真实参数估计值,解决DQN模型中的参数不确定性问题.实验结果表明:DQN-EKF配时方法适用于不同的交通环境,并能够有效提高车辆的通行效率.
深度Q学习网络(DQN)、感知能力、决策能力、交通信号灯配时系统、参数不确定性、扩展卡尔曼滤波(EKF)
48
V221+.3;TB553(飞机构造与设计)
国家自然科学基金;河南省软科学研究计划
2022-09-05(万方平台首次上网日期,不代表论文的发表时间)
共11页
1353-1363