基于规则约束的深度强化学习智能车辆高速路场景下行驶决策

引用

摘要：

针对强化学习算法下智能车辆训练中动作选择过程随机性强、训练效率低等问题,提出了基于规则约束和深度Q网络(DQN)算法的智能车辆行驶决策框架,将引入的规则分为与换道相关的硬约束和与车道保持相关的软约束,分别通过动作检测模块(Action Detection Module)与奖励函数来实现.同时结合竞争深度Q网络(Dueling DQN)和双重深度Q网络(Double DQN)对DQN的网络结构进行改进,并引入N步自举(N-Step Bootstrapping)学习提高DQN的训练效率,最后在Highway-env平台高速路场景下与原始DQN算法进行综合对比验证模型的有效性,改进后的算法提高了智能车辆任务成功率和训练效率.

关键词：深度强化学习、行驶决策、智能车辆、规则约束、改进DQN算法

分类号：U461.91(汽车工程)

资助基金：山东省自然科学基金ZR2019MF056

在线出版日期：2023-11-21（万方平台首次上网日期，不代表论文的发表时间）

页数：共9页

页码：18-26

英文信息展示

期刊专题