10.3969/j.issn.1002-0268.2007.05.027
基于Q学习的Agent在单路口交通控制中的应用
将Agent技术与Q学习算法相结合,应用到城市交通控制领域中,对单交叉口的交通流进行了控制研究,介绍了路口Agent的结构模型以及基于Q学习算法的学习机制的实现,提出了一种适用于交通控制的奖惩函数.即当红灯相位的饱和度大于绿灯相位的饱和度时,红灯相位的相对警界度在奖惩函数中占主导地位,此时大部分情况下会对Agent进行惩罚;在以后的决策过程中面对类似的交通状态Agent所选择的控制行为更倾向于将通行权切换给下一个相位,反之,Agent所选择的行为倾向于保持'-3前相位的通行权到下一决策时刻.并通过微观交通仿真软件Paramics对控制算法进行仿真研究,仿真结果表明该方法的控制效果优于定时控制,同时验证了奖惩函数的有效性.
交通工程、单交叉口、Q学习、奖惩函数、交通流
24
U491(交通工程与公路运输技术管理)
北京市教委科技发展计划项目TM2004100051;北京市自然科学基金4042006;北京工业大学校科研和教改项目52002011200402
2007-06-18(万方平台首次上网日期,不代表论文的发表时间)
共4页
117-120