10.19961/j.cnki.1672-4747.2021.11.021
基于深度强化学习的无信号交叉口车辆协同控制算法
针对未来智慧城市智能网联汽车通过无信号交叉口的通行效率问题,本文基于深度强化学习提出了一种渐进式价值期望估计的多智能体协同控制算法(PVE-MCC).设计了基于渐进式学习的价值期望估计策略,通过动态改变价值期望学习目标,保证值函数网络渐进式地持续学习,避免策略网络陷入局部最优解,并将该策略与泛化优势估计算法结合,提升算法收敛精度和稳定性.其次,以通行效率、安全性和舒适性为优化目标,设计了多目标奖励函数来提高多智能体协同控制的综合性能.此外,无信号交叉口易出现的"死锁"现象给多车协同控制带来了巨大的挑战,针对这一问题,基于链表环形检测算法设计了启发式的"死锁"检测-破解干预策略,实现对"死锁"环的提前检测和破解,进一步保障交通通行的安全性.最后,本文搭建了双向六车道无信号交叉口场景的仿真实验平台,进行功能和性能验证.实验结果表明,PVE-MCC算法比现有方案提高交通流量30.47%,单车效率提升了95.56%,舒适性提升了53.82%.
智能交通、协同控制、强化学习、无信号交叉口、智能网联汽车
20
U471.15
产业技术基础公共服务平台项目2019-00892-2-1
2022-06-17(万方平台首次上网日期,不代表论文的发表时间)
共11页
14-24