基于强化学习的干线信号混合协同优化方法
万方数据知识服务平台
应用市场
我的应用
会员HOT
万方期刊
×

点击收藏,不怕下次找不到~

@万方数据
会员HOT

期刊专题

10.16097/j.cnki.1009-6744.2022.02.014

基于强化学习的干线信号混合协同优化方法

引用
交通拥堵已成为很多大中城市普遍存在的社会问题.信号控制作为缓堵保畅的重要措施之一,愈发受到社会关注.信号优化手段可分为模型驱动和数据驱动两类,且随着交通大数据的不断充实,基于强化学习的数据驱动方法日益成为新兴发展方向.然而,现有数据驱动类研究主要偏重于决策模型设计,缺乏对智能体结构的探讨;同时,在多路口协同方面多采用分布式策略,忽略了智能体之间信息交互,无法保障区域层面的整体最优性.为此,本文以干线信号为对象,构建一种多智能体混合式协同决策的信号优化方法.首先,针对交通状态的多样性、异构性及数据不均衡性,设计分布训练-分区记忆的单智能体决策模型,并优化状态空间和回报函数,界定单路口控制的最佳方案;其次,融合分布式和集中式学习的模型优势设计多智能体交互方法,在单路口分布式控制的基础上,设置中心智能体评价局部智能体的决策行为并反馈附加回报以调整局部智能体的决策模型,实现干线多信号的协同运行.最后,搭建仿真平台完成效果测试与算法对比.结果表明:新方法与独立优化和分布式协同相比,在支路交通流基本不受影响的前提下,干线停车次数分别降低了14.8%和13.6%,具有更好的控制效果.

智能交通、协同决策、深度强化学习、智能体设计、中心智能体

22

U491.4(交通工程与公路运输技术管理)

2022-05-05(万方平台首次上网日期,不代表论文的发表时间)

共9页

145-153

相关文献
评论
暂无封面信息
查看本期封面目录

交通运输系统工程与信息

1009-6744

11-4520/U

22

2022,22(2)

相关作者
相关机构

专业内容知识聚合服务平台

国家重点研发计划“现代服务业共性关键技术研发及应用示范”重点专项“4.8专业内容知识聚合服务技术研发与创新服务示范”

国家重点研发计划资助 课题编号:2019YFB1406304
National Key R&D Program of China Grant No. 2019YFB1406304

©天津万方数据有限公司 津ICP备20003920号-1

信息网络传播视听节目许可证 许可证号:0108284

网络出版服务许可证:(总)网出证(京)字096号

违法和不良信息举报电话:4000115888    举报邮箱:problem@wanfangdata.com.cn

举报专区:https://www.12377.cn/

客服邮箱:op@wanfangdata.com.cn