10.3969/j.issn.1000-3428.2011.17.051
基于CMAC强化学习的交叉口信号控制
采用神经网络值函数逼近的强化学习方法处理交叉口的信号控制.根据交通流及交叉口信号特征,建立强化学习的状态空间、动作空间和回报空间,以最小化车辆在交叉口的延误为控制目标,对信号进行优化控制.引入小脑模型关节控制器神经网络对强化学习(RL)的Q值进行逼近.在变化的交通条件下,使用典型交叉口对提出的RL模型进行验证,同传统的定时控制和全感应控制进行对比分析.仿真结果表明,RL控制器具有较强的学习能力,可以适应交通流的动态变化,稳定性好、自适应性强,对于环境变化具有较强的适应能力.
交通控制、强化学习、小脑模型关节控制器、非均匀量化、信号交叉口
37
U491(交通工程与公路运输技术管理)
中央高校基本科研业务费专项基金资助项目CHD2009JC060
2012-01-14(万方平台首次上网日期,不代表论文的发表时间)
共3页
152-154