基于博弈论的右转无信号交叉口行人行为模拟
为逼真模拟行人-车辆交互的真实交通场景,融合博弈理论和数据驱动的思想,在逆强化学习和博弈论的基础上提出博弈——深度最大熵逆强化学习算法(Game-deep max entropy inverse reinforcement learning,G-DMIRL).将行人建模为智能体,通过真实的行人-车辆交互轨迹获取不同博弈决策下的行人的奖励函数,并推断行人-车辆交互的博弈机制,利用获取的奖励函数和动作策略开发出行人行为模拟模型.仿真结果表明,开发的模型在有限状态下能够准确地模拟出不同决策下行人的行为动作,建立的行人-车辆交通场景能够为自动驾驶汽车的识别、预测与路径规划算法的开发验证提供支撑.
逆强化学习、强化学习、行人-车辆交互、博弈论、右转交叉口
60
U492;TP391(交通工程与公路运输技术管理)
重庆市自然科学基金;重庆市留学人员回国创业创新支持计划;重庆市教委科学技术研究;重庆市技术创新与应用发展专项重大资助项目
2024-08-07(万方平台首次上网日期,不代表论文的发表时间)
共16页
86-101