DOI：10.3963/j.jssn.1674-4861.2020.05.008

基于DQN的车辆驾驶行为决策方法

引用

摘要：

针对传统DQN算法下网联车驾驶行为决策的动作选择过程随机性强、探索空间大的问题,研究了结合专家知识和DQN算法的智能车辆决策框架,设计了奖励值函数来引导算法的训练.通过层次分析法(AHP)选取高速场景下车辆驾驶决策中的重要影响因素,利用ID3决策树构建简单而有效的专家规则库;在传统算法基础上,通过设计奖励值函数来优化DQN网络结构,由奖励值函数引导DQN算法来解决高速场景下的车辆决策问题,并在Python仿真环境中构建高速交通场景对该算法进行分析和验证.实验结果表明,在高速直道和并道场景下,达到95％成功率的平均训练次数分别减少了100次和200次,平均奖励值分别提高了4.02和1.34,有效加快了DQN算法的动作选择,降低了探索过程中的动作随机性.

关键词：智能驾驶、强化学习、DQN算法、专家知识

所属期刊栏目：38

分类号：U471.1

资助基金：国家重点研发计划项目;湖北省创新群体项目

在线出版日期：2021-03-02（万方平台首次上网日期，不代表论文的发表时间）

页数：共12页

页码：67-77,112

英文信息展示

期刊专题