基于深度确定性策略梯度的智能车汇流模型

引用

摘要：

采用离散动作空间描述速度变化的智能车汇流模型不能满足实际车流汇入场景的应用要求,而深度确定性策略梯度(DDPG)结合策略梯度和函数近似方法,采用与深度 Q 网络(DQN)相同的网络结构,并使用连续动作空间对问题进行描述,更适合描述智能车速度变化.为此,提出一种基于 DDPG算法的智能车汇流模型,将汇流问题转化为序列决策问题进行求解.实验结果表明,与基于 DQN 的模型相比,该模型的收敛速度较快,稳定性和成功率较高,更适合智能车汇入车辆场景的应用.

关键词：智能车、汇流、深度确定性策略梯度、深度Q网络、连续动作空间

所属期刊栏目：46

分类号：TP18(自动化基础理论)

资助基金：国家自然科学基金91420202

在线出版日期：2020-03-28（万方平台首次上网日期，不代表论文的发表时间）

页数：共6页

页码：87-92

英文信息展示

期刊专题